Un Data Mart est une archive thématique qui stocke les données et utilise l'ensemble des informations récupérées pour répondre aux besoins d'une fonction ou d'un service opérationnel particulier.
Temps de lecture : 5 mn
Un Data Warehouse recueille des données de sources variées et hétérogènes afin de faciliter la prise de décision. Il permet donc de stocker une très grande quantité de données provenant de différents services au sein de l’entreprise.
Les données sont une grande source d’informations pour chacun des services. Ils doivent pouvoir accéder aux données les plus pertinentes, dans les plus brefs délais. Le Data Warehouse rassemble ces données, mais le temps de traitement des requêtes peut être long notamment pour des demandes très spécifiques. Un Data Mart permet de répondre à ces problématiques.
Un Data Mart est une forme simple de Data Warehouse centré sur un seul sujet ou fonction, comme les ventes, le marketing ou la finance. Ils permettent d’améliorer le temps de réponse des utilisateurs grâce au catalogage des données spécifiques. Cependant, une spécialisation ne signifie pas nécessairement une petite taille. Les Data Marts peuvent contenir des millions d'enregistrements et nécessiter des gigaoctets de stockage.
Dans un modèle de Cloud traditionnel, une base de données s'exécute sur l'infrastructure du département informatique via une machine virtuelle. Les tâches de surveillance et de gestion des bases de données incombent au personnel informatique de l'organisation.
Il y a deux écoles de penser sur la façon dont un Data Warehouse et un Data Mart devraient être conçus et organisé.
L'approche « Top-Down » de Bill Inmon favorise une conception dans laquelle le Data Warehouse est un référentiel de données centralisé. Des Data Marts liés à des secteurs d'activité spécifiques peuvent être créés à partir du Data Warehouse lorsqu'ils sont nécessaires. Dans son modèle, le Data Warehouse est la source des données qui se retrouvent dans les différents Data Marts. Cela garantit l'intégrité et la cohérence des données dans l'ensemble de l'organisation.
Ralph Kimball soutient que la meilleure approche consiste à se focaliser autour des départements les plus importants de l’entreprise. Dans cette approche « Bottom-up », une organisation crée des Data Marts qui permettent de regrouper les données pertinentes autour de domaines spécifiques. Le Data Warehouse est la combinaison des différents Data Marts de l'organisation. Ceci contraste avec l'approche d'Inmon, qui crée des Data Marts basés sur les informations contenues dans le Data Warehouse.
Le choix de la meilleure approche dépend de l’activité de l’entreprise ainsi que de ses objectifs. Chaque approche à ses avantages et inconvénients et une approche « hybrid », c’est-à-dire concevoir à la fois un Data Warehouse et des Data Marts spécifiques, peut être envisagé.
Un Data Warehouse fournit un référentiel unique et pratique pour toutes les données de l'entreprise, mais le coût de mise en œuvre d'un tel système sur site est beaucoup plus élevé que celui de la construction de data marts. En raison de contraintes de temps et de ressources, il est généralement logique de construire d’abord les Data Marts et de développer un Data Warehouse par la suite.
Cependant, les services de Data Warehouse dans le Cloud ont raccourci le temps et réduitsen les coûts de mise en place des Data Warehouse. Ces services sont rentables, évolutifs et accessibles. Grâce notamment aux bases de données autonomes, la gestion et l’entretien d’un Data Warehouse n’est plus un obstacle pour l’entreprise. Toutes les entreprises peuvent tirer parti de l'infrastructure Cloud et créer d'abord un Data Warehouse.