Explorador de recursos do Analytics Platform

Modelo de dados

A modelagem de dados é o processo de representar dados de maneira fácil para os usuários de negócios entenderem e encontrarem respostas para suas perguntas. A modelagem de dados requer uma abordagem centralizada para garantir métricas corporativas consistentes, bem como uma abordagem de autoatendimento para que os usuários de negócios misturem dados para apoiar suas investigações de dados.

Modelagem de dados

A modelagem de dados é essencial para fornecer dados de uma forma pronta para responder às perguntas mais esperadas dos negócios e garantir uma visualização consistente de todos os números corporativos. Os modelos de dados também ignoram a complexidade da maneira física como os dados são armazenados, apresentando aos usuários de negócios exibições dos dados que fazem sentido para eles. Por exemplo, os usuários de finanças não precisam entender as linguagens de consulta SQL ou MDX, mas podem consultar facilmente um sistema de gerenciamento de banco de dados relacionais (RDBMS) ou o cubo do Essbase utilizando termos financeiros reconhecíveis de seu próprio vocabulário.

O modelo de dados é um único local para definir cálculos de negócios corporativos. Independentemente de como ou onde esses cálculos sejam usados, o valor será consistente e confiável. Por exemplo, a métrica custo de contratação teria os sistemas de origem aplicáveis mapeados corretamente e o cálculo definido centralmente. Por conseguinte, qualquer processo de visualização ou geração de relatórios que chamasse essa métrica sempre mostraria o mesmo número.

Modelo semântico controlado

Desenvolva e forneça modelos semânticos confiáveis e governados para garantir uma exibição consistente de dados essenciais aos negócios. Mapeie dados complexos em termos comerciais e familiares e consistentes. Desenvolva uma consulta otimizada e devidamente ajustada para execução

O modelo semântico é composto por três camadas: a primeira é a camada física, que alimenta a camada lógica, que então alimenta a camada de apresentação. A camada física mapeia os sistemas de origem de dados físicos da organização e geralmente é configurada e gerenciada pela TI. A camada lógica é usada para criar cálculos de negócios, hierarquias e mapeamento de várias origens de dados em áreas de relatório lógicas. Por exemplo, o sistema ERP e o data warehouse podem ser mapeados juntos para áreas de relatórios financeiros. A camada de apresentação é como os usuários recebem os atributos e as métricas disponíveis para criar suas histórias de análise. Embora todos os dados sejam calculados de forma consistente, a visualização específica de um usuário desses dados é filtrada com base em seu acesso de segurança e autorização.

Figura 1: Revisão da linhagem de dados na ferramenta de modelagem semântica

O modelo semântico também é visível para ferramentas de visualização de terceiros (por exemplo, Tableau, Power BI ou aplicativos personalizados) como uma origem JDBC. Isso garante que, se alguns grupos de negócios escolherem diferentes ferramentas de visualização, as métricas empresariais só precisarão ser definidas uma vez e permanecerem consistentes em todas as plataformas de relatórios da empresa.

Saiba mais sobre a camada semântica


Modelagem de dados de autoatendimento

Os usuários podem juntar diretamente duas ou mais tabelas e controlar a relação, por exemplo, junções internas ou externas, por meio do autoatendimento. Compartilhe facilmente com outros colegas modelos de dados de autoatendimento.

Assista a uma demonstração do conjunto de dados de várias tabelas (2:57)


Figura 2: Modelagem de dados de autoatendimento

Saiba mais sobre modelagem de dados de autoatendimento

Aumento de dados e recomendações

Os conjuntos de dados podem ser aumentados com dados, atributos ou transformações adicionais. O conhecimento de referência incorporado inclui:

  • Enriquecimentos do sistema de posicionamento global:
    Latitude e longitude de referência para cidades ou CEPs.
  • Enriquecimentos baseados em referência:
    Atribua o gênero usando o nome da pessoa como o atributo que define a decisão de gênero.
  • Concatenações de coluna:
    Vincule o nome e o sobrenome de uma pessoa em uma coluna.
  • Extrações de partes:
    Separe o número da casa do nome da rua em um endereço.
  • Extrações semânticas:
    Extraia informações de um tipo semântico reconhecido, como o domínio de um endereço de e-mail.
  • Extrações de parte de data:
    Extraia o dia da semana de uma data que usa um formato de dia/mês/ano (ou mês/dia/ano) para tornar os dados mais úteis nas visualizações.
  • Ofuscação completa e parcial:
    A máscara detectou campos confidenciais, como números de cartão de crédito ou previdência social.
  • Recomendações comuns:
    Exclua colunas que contêm campos confidenciais detectados.
  • Enriquecimentos de conhecimento personalizados:
    Aproveite inclusões personalizadas que o administrador adicionou ao Oracle Analytics.

Figura 3: Configurando o conhecimento de referência personalizado

Linguagem de Marcação de Modelador Semântico (SMML)

Os desenvolvedores de modelos de dados podem criar, editar e ajustar modelos semânticos usando a ferramenta gráfica baseada na Web; no entanto, outra abordagem é modificar modelos programaticamente usando a Linguagem de Marcação de Modelador Semântico (SMML). A SMML é uma linguagem de marcação em JSON que descreve os objetos do modelo semântico em tempo de design. Cada arquivo SMML representa um objeto no modelo semântico. Você pode usar arquivos SMML para migração de metadados, geração e manipulação de metadados programáticos, aplicação de patches de metadados e outras funções. Isso significa que os desenvolvedores podem editar o código do modelo semântico diretamente ou aplicar alterações por meio de outros processos programáticos simplesmente fazendo alterações textuais diretamente na definição SMML.


Figura 4: Linguagem de Marcação de Modelador Semântico (SMML) baseada em JSON

Desenvolvimento de modelo de vários usuários e integração do Git

O modelador semântico se integra a qualquer repositório compatível com Git, como GitHub, GitLab ou Git no Oracle Visual Builder, para fornecer um ambiente de desenvolvimento integrado, colaborativo e de vários usuários e controle de origem. A integração do Git para desenvolvimento de vários usuários suporta operações de ramificação, mesclagem, extração e envio e permite visibilidade total do ciclo de vida de desenvolvimento do modelo semântico.


Figura 5: Desenvolvimento de vários usuários com integração do Git