Aucun résultat trouvé

Votre recherche n’a donné aucun résultat.

Nous vous suggérons d’essayer ce qui suit pour trouver ce que vous recherchez :

  • Vérifiez l’orthographe de votre recherche par mot clé.
  • Utilisez des synonymes pour le mot clé que vous avez tapé, par exemple, essayez “application” au lieu de “logiciel”.
  • Essayez l’une des recherches populaires ci-dessous.
  • Lancer une nouvelle recherche.
Questions tendances

Qu’est-ce qu’un data warehouse ?

Un « data warehouse » est un type de système de gestion de données conçu pour permettre et prendre en charge les activités de BI (Business Intelligence), en particulier analytiques. Les data warehouses sont uniquement destinés à effectuer des requêtes et des analyses. Ils contiennent souvent de grandes quantités de données historiques. Les données contenues dans un data warehouse proviennent généralement d’un large éventail de sources telles que les fichiers journaux d’application et les applications transactionnelles.

Un data warehouse centralise et consolide de grandes quantités de données provenant de plusieurs sources. Ses capacités analytiques permettent aux organisations de tirer de leurs données de précieuses informations commerciales leur permettant d’améliorer leur processus de prise de décision. Au fil du temps, il crée un enregistrement historique qui peut s’avérer inestimable pour les data scientists et les analystes métiers. En raison de ces capacités, un data warehouse peut être considéré comme la « source unique d’informations fiables » d’une entreprise.

Un data warehouse classique comprend souvent les éléments suivants :

  • Une base de données relationnelle pour stocker et gérer les données
  • Une solution d’extraction, de chargement et de transformation pour la préparation des données en vue de l’analyse
  • Des capacités d’analyse statistique, de reporting et d’exploration de données
  • Des outils d’analyse client pour la visualisation et la présentation de données aux utilisateurs professionnels
  • D’autres applications analytiques plus sophistiquées générant des informations
  •  exploitables en appliquant des algorithmes de machine learning et d’intelligence artificielle (IA)

Pourquoi ne pas exécuter d’analyses par rapport à votre environnement OLTP ?

Les data warehouses sont des environnements relationnels utilisés pour l’analyse des données, en particulier des données historiques. Les entreprises utilisent des data warehouses pour découvrir au sein de leurs données des tendances et des relations qui se développent au fil du temps.

En revanche, les environnements transactionnels permettent de traiter les transactions en continu et sont couramment utilisés pour la saisie des commandes et les transactions financières et de détail. Ils ne s’appuient pas sur des données historiques. En fait, dans les environnements OLTP, les données historiques sont souvent archivées ou simplement supprimées afin d’améliorer les performances.

Les data warehouses et les systèmes OLTP diffèrent considérablement.

Data warehouse Système OLTP
Charge de travail Prend en charge les requêtes ad hoc et l’analyse des données Prend en charge uniquement les opérations prédéfinies
Modifications de données Mises à jour automatiques et régulières Mises à jour par les utilisateurs finaux émettant des relevés individuels
Conception de schémas Utilise des schémas partiellement dénormalisés pour optimiser les performances Utilise des schémas entièrement normalisés pour garantir la cohérence des données
Balayage de données Englobe des milliers à des millions de lignes Accède à seulement une poignée d’enregistrements à la fois
Données historiques Stocke de nombreux mois ou années de données Stocke les données pour quelques semaines ou mois seulement

Data Warehouses, Data Marts et magasins de données opérationnels

Bien qu’ils remplissent des rôles similaires, les data warehouses sont différents des data marts et des magasins de données opérationnels (MDO). Un data mart remplit les mêmes fonctions qu’un data warehouse mais dans un champ beaucoup plus limité, généralement un seul service ou secteur d’activité. Cela rend les data marts plus faciles à établir que les data warehouses. Cependant, ils ont tendance à introduire des incohérences, car il peut s’avérer difficile de gérer et de contrôler de manière uniforme les données dans de nombreux data marts.

Les MDO ne prenant en charge que les opérations quotidiennes, leur vue sur les données historiques est très limitée. Bien qu’ils fonctionnent très bien comme sources de données actuelles et soient souvent utilisées comme tels par les data warehouses, ils ne prennent pas en charge les requêtes riches en historique.

Ai-je besoin d’un lac de données ?

Les entreprises utilisent à la fois des lacs de données et des data warehouses pour des volumes de données importants provenant de différentes sources. Le choix du moment d’utilisation de l’un ou de l’autre dépend de ce que l’entreprise a l’intention de faire avec les données. Les paragraphes suivants décrivent la meilleure utilisation de chaque option :

  • Les lacs de données stockent une énorme quantité de données disparates non filtrées à utiliser ultérieurement dans un but particulier. Les données provenant d’applications sectorielles, d’applications mobiles, des réseaux sociaux, de terminaux IoT, et ainsi de suite, sont capturées sous forme de données brutes dans un lac de données. La structure, l’intégrité, la sélection et le format des divers jeux de données sont dérivés au moment de l’analyse par la personne qui effectue l’analyse. Lorsque les entreprises ont besoin d’une solution de stockage à faible coût pour les données non formatées et non structurées provenant de plusieurs sources et qu’elles comptent utiliser à l’avenir, un lac de données peut constituer le choix approprié.
  • Les data warehouses sont spécifiquement destinés à l’analyse de données. Le traitement analytique au sein d’un data warehouse est effectué sur des données préparées pour l’analyse (c’est-à-dire rassemblées, contextualisées et transformées) dans le but de générer des informations basées sur l’analyse. Les data warehouses sont également aptes à traiter de grandes quantités de données provenant de diverses sources. Lorsque les entreprises ont besoin d’analyses de données avancées ou d’une analyse qui s’appuie sur des données historiques provenant de plusieurs sources au sein de leur entreprise, l’option data warehouse est probablement le bon choix.

Avantages d’un data warehouse

Les data warehouses offrent l’avantage unique et fondamental de permettre aux entreprises d’analyser de grandes quantités de variantes de données et d’en extraire une valeur significative, ainsi que de conserver un enregistrement historique.

Quatre caractéristiques uniques (décrites par l’informaticien William Inmon, considéré comme le père du data warehouse) permettent aux data warehouses d’offrir cet avantage primordial. Selon cette définition, les data warehouses sont

  • Orientés sujet. Ils sont capables d’analyser des données sur un sujet ou un domaine fonctionnel particulier (comme les ventes).
  • Intégrés. Les data warehouses créent une cohérence entre différents types de données provenant de sources disparates.
  • Non volatiles. Une fois que les données sont dans un data warehouse, elles sont stables et ne changent pas.
  • À variante temporelle. L’analyse de data warehouse examine l’évolution dans le temps.

Un data warehouse bien conçu effectuera des requêtes très rapidement, fournira un débit de données élevé et fournira suffisamment de flexibilité aux utilisateurs finaux pour « décomposer » ou réduire le volume de données pour un examen plus approfondi afin de répondre à une variété de demandes, que ce soit à un niveau élevé ou à un niveau très fin et détaillé. Le data warehouse sert de base fonctionnelle pour les environnements BI de middleware fournissant aux utilisateurs finaux des rapports, des tableaux de bord et d’autres interfaces.

Architecture d’un data warehouse

L’architecture d’un data warehouse est déterminée par les besoins spécifiques de l’entreprise. Les architectures courantes incluent

  • Simple. Tous les data warehouses partagent une conception de base dans laquelle les métadonnées, les données de synthèse et les données brutes sont stockées dans leur référentiel central. Le référentiel est alimenté par des sources de données à une extrémité et il est accessible par les utilisateurs finaux à des fins d’analyse, de reporting et d’exploration à l’autre extrémité.
  • Simple avec une zone de transfert. Les données opérationnelles doivent être nettoyées et traitées avant d’être placées au sein du data warehouse. Bien que cela puisse être réalisé par l’intermédiaire d’un programme, de nombreux data warehouses ajoutent une zone de transfert intermédiaire pour les données avant leur entrée dans le data warehouse, afin de simplifier leur préparation.
  • Structure en étoile. L’ajout de data marts entre le référentiel central et les utilisateurs finaux permet à une entreprise de personnaliser son data warehouse afin de desservir divers secteurs d’activité. Lorsque les données sont prêtes à être utilisées, elles sont déplacées vers le data mart approprié.
  • Sandboxes. Les sandboxes sont des zones privées et sécurisées qui permettent aux entreprises d’explorer rapidement et de manière informelle de nouveaux jeux de données ou de nouvelles méthodes d’analyse des données qui ne nécessitent pas de se conformer aux règles et au protocole formels du data warehouse.

L’évolution des data warehouses — De l’analyse de données à l’IA et au machine learning

Lorsque les data warehouses ont fait leur apparition à la fin des années 1980, leur objectif était de faciliter la circulation des données des systèmes opérationnels vers les systèmes d’aide à la décision (SAD). Ces premiers data warehouses nécessitaient un volume de redondance énorme. La plupart des entreprises disposaient de plusieurs environnements SAD adaptés à leurs différents utilisateurs. Bien que les environnements SAD utilisaient en grande partie les mêmes données, la collecte, le nettoyage et l’intégration des données étaient souvent répliqués pour chaque environnement.

À mesure que les data warehouses devenaient plus efficaces, ils passaient de magasins d’informations prenant en charge les plateformes de BI classiques à de larges infrastructures analytiques prenant en charge une grande variété d’applications, telles que les analyses opérationnelles et la gestion des performances.

Les itérations de data warehouse ont progressé au fil du temps pour fournir une valeur supplémentaire incrémentielle à l’entreprise.

Étape Capacité Valeur commerciale
1 Reporting transactionnel Fournit des informations relationnelles pour créer des instantanés des performances commerciales
2 Décomposition, requête ad hoc, outils de BI Étend les capacités pour des informations plus approfondies et une analyse plus robuste
3 Prédiction des performances futures (exploration de données) Développe des visualisations et la Business Intelligence prospective
4 Analyse tactique (spatiale, statistique) Propose des scénarios « hypothétiques » pour éclairer les décisions pratiques basées sur une analyse plus complète
5 Stocke de nombreux mois ou années de données Stocke les données pour quelques semaines ou mois seulement

La prise en charge de chacune de ces cinq étapes a nécessité une variété croissante de jeux de données. Les trois dernières étapes en particulier créent l’impératif d’une gamme encore plus étendue de capacités en matière de données et d’analyse.

Aujourd’hui, l’IA et le machine learning transforment presque tous les actifs du secteur d’activité, des services et des entreprises. Les data warehouses ne font pas exception à la règle. L’expansion de Big Data et l’application de nouvelles technologies digitales entraînent une modification des exigences et des capacités des data warehouses.

Le data warehouse autonome représente la dernière étape de cette évolution. Il offre aux entreprises la possibilité d’extraire encore plus de valeur de leurs données tout en réduisant les coûts et en améliorant la fiabilité et les performances du data warehouse.

Découvrez-en davantage sur les data warehouses autonomes et démarrez avec votre propre data warehouse autonome.

Conception d’un data warehouse

Lorsqu’une entreprise entreprend de concevoir un data warehouse, elle doit commencer par définir ses besoins métier spécifiques, définir le champ d’application et élaborer un concept. L’entreprise peut ensuite créer à la fois la conception logique et physique pour le data warehouse. La conception logique implique les relations entre les objets et la conception physique représente le meilleur moyen de stocker et de récupérer les objets. La conception physique intègre également les processus de transport, de sauvegarde et de récupération.

Toute conception de data warehouse doit prendre en considération les éléments suivants :

  • Contenu de données spécifique
  • Relations au sein des groupes de données et entre eux
  • Environnement système qui prendra en charge le data warehouse
  • Types de transformations de données nécessaires
  • Fréquence d’actualisation des données

Les besoins des utilisateurs finaux constituent un facteur primordial dans la conception. La plupart des utilisateurs finaux sont intéressés par l’analyse et par l’examen de données agrégées plutôt que par des transactions individuelles. Cependant, les utilisateurs finaux ne savent souvent pas vraiment ce qu’ils veulent avant qu’un besoin spécifique ne survienne. Par conséquent, le processus de planification doit inclure une exploration suffisante pour anticiper les besoins. Enfin, la conception du data warehouse doit permettre une expansion et une évolution permettant de répondre aux besoins en constante évolution des utilisateurs finaux.

Le Cloud et le data warehouse

Les data warehouses dans le Cloud offrent les mêmes caractéristiques et avantages que les data warehouses sur site, mais avec les avantages supplémentaires du cloud computing, tels que la flexibilité, l’évolutivité, l’agilité, la sécurité et des coûts réduits. Les data warehouses dans le Cloud permettent aux entreprises de se concentrer exclusivement sur l’extraction de valeur de leurs données plutôt que de devoir créer et gérer l’infrastructure matérielle et logicielle nécessaire à la prise en charge du data warehouse.

En savoir plus sur Oracle Cloud et les data warehouses (PDF)

Déploiement de complexité zéro : le data warehouse autonome

L’itération la plus récente du data warehouse est la data warehouse autonome, qui repose sur l’IA et le machine learning pour éliminer les tâches manuelles et simplifier la configuration, le déploiement et la gestion des données. Une data warehouse autonome en tant que service dans Cloud ne nécessite aucune intervention humaine pour l’administration de base de données, la configuration ou la gestion du matériel, ni l’installation de logiciel.

La création du data warehouse, la sauvegarde, la correction et la mise à niveau de la base de données, ainsi que l’extension ou la réduction de la base de données sont toutes effectuées automatiquement, avec le même degré de flexibilité, d’évolutivité, d’agilité et de réduction des coûts qu’offrent les plateformes Cloud. Le data warehouse autonome élimine la complexité, accélère le déploiement et libère des ressources pour que les entreprises puissent se concentrer sur des activités qui ajoutent de la valeur à l’entreprise.

Oracle Autonomous Data Warehouse

Oracle Autonomous Data Warehouse est un data warehouse facile à utiliser, entièrement autonome, évolutif de manière élastique, offrant des performances de requête rapides et ne nécessitant aucune administration de base de données. La configuration d’Oracle Autonomous Data Warehouse est très simple et rapide.

En savoir plus sur Oracle Autonomous Data Warehouse (PDF)