La modélisation des données est le processus qui consiste à représenter les données dans un formulaire facile à comprendre pour aider les collaborateurs à trouver des réponses à leurs questions. La modélisation des données nécessite une approche centralisée pour garantir la cohérence des mesures de l'entreprise, ainsi qu'une approche en libre-service permettant aux professionnels de combiner les données pour prendre en charge leurs enquêtes sur les données.
La modélisation des données est essentielle à la fois pour fournir des données dans un format adéquat pour répondre à la plupart des questions commerciales anticipées et pour garantir une vue cohérente de tous les numéros d'entreprise. Les modèles de données contournent également la complexité de la façon physique dont les données sont stockées et présentent plutôt aux professionnels des vues de leurs données qui leur sont utiles. Par exemple, les utilisateurs financiers n'ont pas besoin de comprendre les langages de requête SQL ou MDX, mais peuvent facilement interroger un système de gestion de base de données relationnelle (SGBDR) ou un cube Essbase à l'aide de termes financiers reconnaissables à partir de leur propre lexique.
Le modèle de données est un emplacement unique pour définir les calculs métier de l'entreprise. Quels que soient la façon ou l'endroit où ces calculs sont utilisés, la valeur reste cohérente et fiable. Par exemple, les systèmes sources définis sont mappés correctement pour la métrique de coût d'embauche et le calcul est défini de manière centralisée. Ensuite, tout processus de visualisation ou de reporting appelant cette mesure montrera toujours le même nombre.
Développez et fournissez des modèles sémantiques fiables et gérés pour garantir une vue cohérente des données stratégiques de l'entreprise. Mappez des données complexes avec des termes métier familiers et cohérents. Concevez une requête précise et optimisée pour l'exécution.
Le modèle sémantique est composé de trois couches : à commencer par la couche physique, qui alimente la couche logique, qui alimente à son tour la couche de présentation. La couche physique mappe les systèmes de source de données physiques de l'entreprise et est généralement configurée et gérée par le service informatique. La couche logique est utilisée pour créer des calculs métier, des hiérarchies et la mise en correspondance de plusieurs sources de données dans des domaines de reporting logiques. Par exemple, le système ERP et le data warehouse peuvent être reliés pour le reporting financier. La couche de présentation présente aux utilisateurs des attributs et des mesures disponibles pour créer leurs scénarios d'analyse. Bien que toutes les données soient calculées de manière cohérente, la vue particulière d'un utilisateur sur ces données est filtrée en fonction de ses accès et de ses autorisations.
Le modèle sémantique est également visible par les outils de visualisation tiers (par exemple, Tableau, Power BI ou applications personnalisées) en tant que source JDBC. Ainsi, si certaines équipes choisissent différents outils de visualisation, les mesures d'entreprise ne doivent être définies qu'une seule fois et restent cohérentes sur toutes les plateformes de reporting de l'entreprise.
En savoir plus sur la couche sémantique
Les utilisateurs peuvent rejoindre directement plusieurs tables et contrôler les relations (par exemple, avec des jointures internes ou externes) en libre-service. Partagez facilement des modèles de données en libre service avec vos collègues.
Regarder une démonstration avec un jeu de données multi-table (2:57)
En savoir plus sur la modélisation de données en libre-service
Les jeux de données peuvent être complétés par des données, des attributs ou des transformations supplémentaires. Les connaissances de référence intégrées comprennent :
Les développeurs de modèles de données peuvent créer, modifier et régler des modèles sémantiques à l'aide de l'outil graphique Web. Cependant, une autre approche consiste à modifier des modèles par programmation à l'aide du langage SMML (Semantic Modeler Markup Language). Le SMML est un langage de balisage basé sur JSON qui décrit les objets du modèle sémantique lors de la conception. Chaque fichier SMML représente un objet dans le modèle sémantique. Vous pouvez utiliser des fichiers SMML pour la migration de métadonnées, la génération et la manipulation de métadonnées par programmation, l'application de correctifs de métadonnées et d'autres fonctions. Les développeurs peuvent ainsi modifier le code du modèle sémantique directement ou appliquer des modifications via d'autres processus programmatiques en modifiant simplement la définition SMML.
Le modélisateur sémantique s'intègre à tous les référentiels Git, tels que GitHub, GitLab ou Git sur Oracle Visual Builder, pour fournir un environnement de développement et un contrôle de source transparents, collaboratifs et multi-utilisateurs. L'intégration Git pour le développement multi-utilisateur prend en charge les opérations de branchement, de fusion, d'extraction et de propagation, tout en offrant une visibilité complète sur le cycle de développement du modèle sémantique.