Explorateur des fonctionnalités de la plateforme Analytics

Modèle de données

La modélisation des données est le processus qui consiste à représenter les données dans un formulaire facile à comprendre pour aider les collaborateurs à trouver des réponses à leurs questions. La modélisation des données nécessite une approche centralisée pour garantir la cohérence des mesures de l'entreprise, ainsi qu'une approche en libre-service permettant aux professionnels de combiner les données pour prendre en charge leurs enquêtes sur les données.

Modélisation des données

La modélisation des données est essentielle à la fois pour fournir des données dans un format adéquat pour répondre à la plupart des questions commerciales anticipées et pour garantir une vue cohérente de tous les numéros d'entreprise. Les modèles de données contournent également la complexité de la façon physique dont les données sont stockées et présentent plutôt aux professionnels des vues de leurs données qui leur sont utiles. Par exemple, les utilisateurs financiers n'ont pas besoin de comprendre les langages de requête SQL ou MDX, mais peuvent facilement interroger un système de gestion de base de données relationnelle (SGBDR) ou un cube Essbase à l'aide de termes financiers reconnaissables à partir de leur propre lexique.

Le modèle de données est un emplacement unique pour définir les calculs métier de l'entreprise. Quels que soient la façon ou l'endroit où ces calculs sont utilisés, la valeur reste cohérente et fiable. Par exemple, les systèmes sources définis sont mappés correctement pour la métrique de coût d'embauche et le calcul est défini de manière centralisée. Ensuite, tout processus de visualisation ou de reporting appelant cette mesure montrera toujours le même nombre.

Modèle sémantique gouverné

Développez et fournissez des modèles sémantiques fiables et gérés pour garantir une vue cohérente des données stratégiques de l'entreprise. Mappez des données complexes avec des termes métier familiers et cohérents. Concevez une requête précise et optimisée pour l'exécution.

Le modèle sémantique est composé de trois couches : à commencer par la couche physique, qui alimente la couche logique, qui alimente à son tour la couche de présentation. La couche physique mappe les systèmes de source de données physiques de l'entreprise et est généralement configurée et gérée par le service informatique. La couche logique est utilisée pour créer des calculs métier, des hiérarchies et la mise en correspondance de plusieurs sources de données dans des domaines de reporting logiques. Par exemple, le système ERP et le data warehouse peuvent être reliés pour le reporting financier. La couche de présentation présente aux utilisateurs des attributs et des mesures disponibles pour créer leurs scénarios d'analyse. Bien que toutes les données soient calculées de manière cohérente, la vue particulière d'un utilisateur sur ces données est filtrée en fonction de ses accès et de ses autorisations.

Figure 1 : Examen du lignage des données dans l'outil de modélisation sémantique

Le modèle sémantique est également visible par les outils de visualisation tiers (par exemple, Tableau, Power BI ou applications personnalisées) en tant que source JDBC. Ainsi, si certaines équipes choisissent différents outils de visualisation, les mesures d'entreprise ne doivent être définies qu'une seule fois et restent cohérentes sur toutes les plateformes de reporting de l'entreprise.

En savoir plus sur la couche sémantique


Modélisation des données en libre-service

Les utilisateurs peuvent rejoindre directement plusieurs tables et contrôler les relations (par exemple, avec des jointures internes ou externes) en libre-service. Partagez facilement des modèles de données en libre service avec vos collègues.

Regarder une démonstration avec un jeu de données multi-table (2:57)


Figure 2 : Modélisation des données en libre-service

En savoir plus sur la modélisation de données en libre-service

Augmentation des données et recommandations

Les jeux de données peuvent être complétés par des données, des attributs ou des transformations supplémentaires. Les connaissances de référence intégrées comprennent :

  • Enrichissements du système de positionnement global :
    Latitude et longitude de référence pour les villes ou les codes postaux.
  • Enrichissements basés sur des références :
    Établir le sexe en utilisant le prénom de la personne comme attribut.
  • Concaténations de colonnes :
    Lier le prénom et le nom d'une personne dans une seule colonne.
  • Extractions de parties :
    séparer le numéro de la maison du nom de la rue dans une adresse.
  • Extractions sémantiques :
    Extraire des informations d'un type sémantique reconnu, tel que le domaine à partir d'une adresse électronique.
  • Extractions des parties de date :
    Extraire le jour de la semaine à partir d'une date qui utilise un format « mois/jour/année » (ou « jour/mois/année ») pour rendre les données plus utiles dans les visualisations.
  • Obfuscation complète et partielle :
    Masque les champs sensibles détectés, tels que les numéros de carte de crédit ou de sécurité sociale.
  • Recommandations courantes :
    Supprime les colonnes contenant des champs confidentiels détectés.
  • Enrichissements personnalisés des connaissances :
    Tire parti des personnalisations que l'administrateur a ajoutées à Oracle Analytics.

Figure 3 : Configuration des connaissances de référence personnalisées

SMML (Semantic Modeler Markup Language)

Les développeurs de modèles de données peuvent créer, modifier et régler des modèles sémantiques à l'aide de l'outil graphique Web. Cependant, une autre approche consiste à modifier des modèles par programmation à l'aide du langage SMML (Semantic Modeler Markup Language). Le SMML est un langage de balisage basé sur JSON qui décrit les objets du modèle sémantique lors de la conception. Chaque fichier SMML représente un objet dans le modèle sémantique. Vous pouvez utiliser des fichiers SMML pour la migration de métadonnées, la génération et la manipulation de métadonnées par programmation, l'application de correctifs de métadonnées et d'autres fonctions. Les développeurs peuvent ainsi modifier le code du modèle sémantique directement ou appliquer des modifications via d'autres processus programmatiques en modifiant simplement la définition SMML.


Figure 4 : Langage SMML (Semantic Modeler Markup Language) basé sur JSON

Développement de modèles multiutilisateurs et intégration Git

Le modélisateur sémantique s'intègre à tous les référentiels Git, tels que GitHub, GitLab ou Git sur Oracle Visual Builder, pour fournir un environnement de développement et un contrôle de source transparents, collaboratifs et multi-utilisateurs. L'intégration Git pour le développement multi-utilisateur prend en charge les opérations de branchement, de fusion, d'extraction et de propagation, tout en offrant une visibilité complète sur le cycle de développement du modèle sémantique.


Figure 5 : Développement multi-utilisateur avec intégration Git