Aucun résultat trouvé

Votre recherche n'a donné aucun résultat.

Qu’est-ce qu’un entrepôt de données?

Un entrepôt de données est un type de système de gestion de données conçu pour permettre et soutenir les activités de veille stratégique, en particulier l’analyse. Les entrepôts de données sont uniquement destinés à l’exécution des interrogations et des analyses. Ils contiennent souvent de grandes quantités de données historiques. Les données dans un entrepôt de données sont habituellement issues d’un large éventail de sources, tels les fichiers journaux des applications et les applications de transaction.

Un entrepôt de données centralise et consolide de grandes quantités de données provenant de plusieurs sources. Ses capacités analytiques permettent aux entreprises de tirer de précieuses analyses commerciales de leurs données afin d’améliorer la prise de décision. Au fil du temps, l’entreprise construit un dossier d’historique, qui peut présenter une valeur inestimable pour les spécialistes des données et les analystes d’affaires. En raison de ces capacités, un entrepôt de données peut être considéré comme une source unique de vérité.

Un entrepôt de données typique inclut souvent les éléments suivants :

  • Une base de données relationnelle pour stocker et gérer les données
  • Une solution d’extraction, de chargement et de transformation (ELT) afin de préparer les données pour l’analyse
  • Des capacités d’analyse statistique, de production de rapports et d’exploration de données
  • Des outils d’analyse client pour la visualisation et la présentation des données aux utilisateurs d’affaires
  • D’autres applications d’analyses plus sophistiquées qui génèrent des prévisions exploitables
  • en appliquant des algorithmes d’apprentissage automatique et d’intelligence artificielle (IA)

Pourquoi ne pas exécuter les analyses dans votre environnement OLTP?

Les entrepôts de données sont des environnements relationnels utilisés pour l’analyse des données, notamment les données historiques. Les organisations utilisent les entrepôts de données pour découvrir des tendances et des relations dans leurs données, qui se développent au fil du temps.

En revanche, les environnements transactionnels sont utilisés pour traiter les transactions sur une base continue et servent souvent pour l’entrée des renseignements financiers et les transactions du commerce de détail. Ils ne reposent pas sur des données historiques. En fait, dans des environnements OLTP, les données historiques sont souvent archivées ou simplement supprimées afin d’améliorer le rendement.

Les entrepôts de données et les systèmes OLTP diffèrent considérablement.

Entrepôt de données Système OLTP
Charge de travail Peut répondre à des demandes et à des analyses de données ad hoc Prend en charge seulement les opérations prédéfinies
Modifications des données Mises à jour automatiques sur une base régulière Mises à jour par les utilisateurs finaux émettant des relevés individuels
Conception du schéma Utilise des schémas dénormalisés pour optimiser les performances Utilise des schémas entièrement normalisés pour garantir la cohérence des données
Balayage des données Compte des milliers, voire des millions de rangées Permet l’accès à seulement quelques enregistrements à la fois
Données historiques Stocke plusieurs mois ou plusieurs années de données Stocke les données de seulement quelques semaines ou mois

Entrepôts de données, dépôts de données, des données et magasins de données d’opérations

Bien qu’ils aient des rôles similaires, les entrepôts sont différents des dépôts de données et des magasins de données d’opérations (ODS). Un dépôt de données répond aux mêmes fonctions qu’un entrepôt de données, mais dans une portée limitée, généralement quant à un service ou à un secteur d’activité. Un dépôt de données est ainsi plus facile à établir qu’un entrepôt de données. Cependant, un dépôt de données peut présenter des problèmes de cohérence, car il peut être difficile de gérer et de contrôler l’uniformité des données dans plusieurs dépôts de données.

Les ODS ne prennent en charge que les opérations quotidiennes. De la sorte, leur historique de données est très limité. Bien qu’ils fonctionnent très bien en tant que sources de données actuelles et qu’ils soient souvent utilisés comme tels par les entrepôts de données, les ODS ne prennent pas en charge les requêtes avec un haut niveau d’historique.

Ai-je besoin d’un lac de données?

Les organisations utilisent à la fois des lacs de données et des entrepôts de données pour les grands volumes de données provenant de diverses sources. Le choix du moment pour l’utilisation de l’une ou l’autre des solutions dépend de ce que l’entreprise a l’intention de faire avec les données. Ce qui suit décrit la meilleure utilisation pour ces types :

  • Les lacs de données stockent une abondance de données non filtrées disparates destinées à être utilisées plus tard pour un usage particulier. Les données proviennent des applications liées à votre secteur d’activité, des applications mobiles, des réseaux sociaux, des appareils IdO. Les données saisies ressemblent à des données brutes et sont stockées dans un lac de données. La structure, l’intégrité, la sélection et le format des divers jeux de données sont calculés au moment de l’analyse par la personne qui effectue l’analyse. Un lac de données peut être le choix idéal lorsque les organisations ont besoin d’un stockage à faible coût pour les données non structurées et non formatées provenant de sources multiples qu’ils prévoient utiliser pour un but précis plus tard.
  • Les entrepôts de données sont conçus spécialement pour analyser les données. Le traitement analytique dans un entrepôt de données est effectué sur des données qui ont été préparées pour l’analyse. Elles sont recueillies, contextualisées et transformées avec l’intention de générer des connaissances basées sur une analyse. Les entrepôts de données sont également en mesure de gérer de grandes quantités de données provenant de diverses sources. Un entrepôt de données est probablement un bon choix lorsque les organisations ont besoin d’analyses avancées des données ou d’analyses d’historique provenant de plusieurs sources de l’entreprise.

Avantages d’un entrepôt de données

Les entrepôts de données offrent des avantages primordiaux et uniques pour les organisations afin de permettre d’analyser de grandes quantités de données et d’extraire beaucoup de valeur de celles-ci. En outre, ils permettent de conserver des enregistrements d’historique.

Quatre caractéristiques uniques (décrite par William Inmon, spécialiste informatique considéré comme étant le père des entrepôts de données) permettent aux entrepôts de données d’offrir les avantages primordiaux. Selon cette définition, les entrepôts de données sont dépendants

  • du sujet. Ils peuvent analyser les données sur un sujet particulier ou un secteur fonctionnel (comme les ventes).
  • Intégré. Les entrepôts de données créent une meilleure uniformité parmi les différents types de données provenant de sources disparates.
  • Non volatiles. Une fois les données se trouvent dans l’entrepôt de données, elles sont stables et ne changent pas.
  • Variation dans le temps. Une analyse d’entrepôt de données porte sur les changements au fil du temps.

Un entrepôt de données bien conçu réalisera des interrogations très rapidement, offrira un flux de données élevé et fournira suffisamment de souplesse pour les utilisateurs finaux afin de décortiquer les données ou de réduire le volume des données pour un examen plus approfondi pour répondre à une grande variété de demandes, que ce soit à un haut niveau ou à un niveau très détaillé. Un entrepôt de données sert de fondement pour les environnements d’intelligence d’affaires intergiciels qui fournissent aux utilisateurs finaux des rapports, des tableaux de bord et d’autres interfaces.

Architecture d’un entrepôt de données

L’architecture d’un entrepôt de données est déterminée par les besoins spécifiques de l’organisation. Les architectures courantes comprennent

  • Simple. Tous les entrepôts de données partagent une conception de base dans laquelle les métadonnées, les données sommaires et les données brutes sont stockées dans un référentiel central de l’entrepôt. Le référentiel est alimenté par des sources de données à une extrémité et accessibles par les utilisateurs finaux à des fins d’analyse, de production de rapports et de forage à l’autre extrémité.
  • Simple, avec aire de stockage temporaire. Les données opérationnelles doivent être nettoyées et traitées avant d’être mises dans l’entrepôt. Bien que cela puisse être fait par programmation, plusieurs entrepôts de données ajoutent une aire de stockage temporaire pour les données avant qu’elles ne soient intégrées dans l’entrepôt de données afin d’en simplifier la préparation.
  • En étoile. L’ajout de dépôts de données entre le référentiel central et les utilisateurs finaux permet à l’organisation de personnaliser l’entrepôt de données afin de mieux servir divers secteurs d’activité. Lorsque les données sont prêtes à être utilisées, elles sont déplacées vers l’entrepôt de données.
  • Bacs à sable. Les bacs à sable sont des régions privées, sécurisées et protégées qui permettent aux entreprises d’explorer rapidement et de manière informelle de nouvelles façons d’analyser les jeux de données ou des données, sans avoir à se conformer aux règles officielles et aux protocoles de l’entrepôt de données.

Évolution des entrepôts de données; des analyses de données à l’IA, en passant par l’apprentissage automatique

Lorsque les premiers entrepôts de données sont entrés en scène, vers la fin des années 1980, leur objectif était de faciliter le flux de données en provenance des systèmes opérationnels vers les systèmes de prise de décisions (DSS). Les premiers entrepôts de données nécessitaient une énorme quantité de redondance. La plupart des organisations disposaient de multiples environnements de DSS qui desservaient leurs utilisateurs variés. Bien que les environnements DSS utilisaient beaucoup les mêmes données, la collecte, le nettoyage et l’intégration des données étaient souvent reproduits pour chaque environnement.

Au fur et à mesure que les entrepôts de données ont gagné en efficacité, ils ont évolué. Ils sont passés des stockages d’informations qui prenaient en charge les plateformes d’intelligence d’affaires traditionnelles à des infrastructures d’analyse qui prennent en charge une grande variété d’applications, telles que les analyses opérationnelles et la gestion du rendement.

Les itérations des entrepôts de données ont progressé au fil du temps afin d’offrir plus de valeurs pour l’entreprise.

Étape Capacité Valeur commerciale
1 Production de rapports transactionnels Offre des informations relationnelles afin de créer des instantanés du rendement des affaires
2 Outils pour décortiquer les données, réaliser des interrogations ad hoc et profiter d’une intelligence d’affaires Étend les capacités pour des analyses plus profondes et plus robustes
3 Prédiction du rendement futur (exploration de données) Élabore des visualisations et une intelligence d’affaires portée vers l’avenir
4 Analyse tactique (spatiale, statistiques) Offre des “scénarios de simulation” pour des décisions pratiques et informées fondées sur une analyse plus complète
5 Stocke plusieurs mois ou plusieurs années de données Stocke les données de seulement quelques semaines ou mois

Chacune de ces cinq étapes a exigé une variété grandissante d’ensembles de données. Les trois dernières étapes en particulier permettent de créer la nécessité d’une plus vaste gamme de données et de capacités d’analyse.

Aujourd’hui, l’intelligence artificielle et l’apprentissage automatique sont en train de transformer la plupart des industries, des services et des actifs d’entreprise, et les entrepôts de données ne font pas exception. L’expansion de données massives et l’application des nouvelles technologies numériques sont les changements importants qui ont mené aux exigences et aux capacités des entrepôts de données.

Un entrepôt de données autonome est la dernière étape de cette évolution. Il offre aux entreprises la possibilité d’extraire encore plus de valeurs de leurs données, tout en réduisant les coûts et en améliorant la fiabilité et les performances de l’entrepôt de données.

Apprenez-en plus sur les entrepôts de données autonomes dans nos livres numériques, puis commencer avec votre propre entrepôt de données autonomes.

Concevoir un entrepôt de données

Lorsqu’une entreprise procède à la création d’un entrepôt de données, elle doit commencer par définir ses besoins spécifiques, se mettre d’accord sur la portée et élaborer d’une définition de concept. L’organisation peut alors créer à la fois la conception logique et physique pour l’entrepôt de données. La conception logique traite des relations entre les objets et la conception physique concerne la meilleure façon d’entreposer et de récupérer les objets. La conception physique intègre également le transport, les sauvegardes et les processus de récupération des données.

Toutes les conceptions d’entrepôt de données doivent permettre ce qui suit :

  • Du contenu de données spécifique
  • Des relations au sein des groupes de données et entre les groupes de données
  • Un environnement de systèmes qui aide les entrepôts de données
  • Des types de transformation de données
  • Une fréquence d’actualisation des données

Un facteur important de la conception est le besoin des utilisateurs finaux. La plupart des utilisateurs finaux souhaitent effectuer des analyses et examiner les données dans leur ensemble, pas seulement les transactions individuelles. Mais souvent, les utilisateurs finaux ne savent pas vraiment ce qu’ils veulent, jusqu’à un besoin particulier se présente. Ainsi, le processus de planification devrait inclure suffisamment de possibilités d’exploration afin d’anticiper les besoins. Enfin, la conception de l’entrepôt de données doit prévoir de l’espace pour l’expansion et la croissance afin de suivre le rythme de l’évolution des besoins des utilisateurs finaux.

Le nuage et les entrepôts de données

Les entrepôts de données en nuage offrent les mêmes caractéristiques et avantages que les entrepôts de données sur place, mais avec les avantages supplémentaires du nuage, comme la souplesse, l’extensibilité, l’agilité, la sécurité et la réduction des coûts. Les entrepôts de données en nuage permettent aux entreprises de se concentrer uniquement sur l’extraction de valeur de leurs données, plutôt que d’établir et de gérer l’infrastructure matérielle et logicielle sous-jacente à l’entrepôt de données.

Lisez à propos d’Oracle Cloud et des entrepôts de données en nuage (PDF)

Un déploiement sans complexité : Un entrepôt de données autonome

La plus récente innovation associée aux entrepôts de données porte sur l’automatisation des procédés. Ainsi, ces solutions exploitent les technologies d’IA et d’apprentissage automatique afin d’éliminer les tâches manuelles et de simplifier la configuration, le déploiement et la gestion des données. Un service d’entrepôt de données autonome en nuage n’exige aucune interversion humaine pour l’administration des bases de données, la configuration ou la gestion de matériel ou l’installation de logiciels.

La création d’un entrepôt de données, la sauvegarde, les mises à niveau, les correctifs, l’expansion ou la réduction de la base de données sont effectués automatiquement, avec la même souplesse, extensibilité, agilité et réduction de coûts associées aux plateformes en nuage. Un entrepôt de données autonome élimine la complexité, facilite le déploiement et libère les ressources pour que les organisations puissent se concentrer sur les activités qui ajoutent de la valeur.

Oracle Autonomous Data Warehouse

Oracle Autonomous Data Warehouse est une solution d’entrepôt de données autonome facile à utiliser et entièrement autonome qui s’adapte facilement, offre des interrogations rapides et qui ne nécessitent pas d’administration de base de données. La configuration Oracle Autonomous Data Warehouse est simple et rapide.

En savoir plus sur Oracle Autonomous Data Warehouse (PDF)