Extract, Transform, and Load (ETL) est le processus le plus utilisé pour l'entreposage et l'analyse des données. Plus récemment, cependant, une autre approche, Extract, Load, and Transform (ELT), a pris de l'ampleur et adopte un style différent et plus moderne pour le traitement des données.
Temps de lecture : 4 mn
Au cours de la dernière décennie, il y a eu une explosion de nouveaux types de données : Big Data, des données provenant des réseaux sociaux, des capteurs, etc. Cette multiplication de type et de volume de données a mis à rude épreuve l'architecture du Data Warehouse.
L'utilisation d'un processus traditionnel ETL pour extraire, transformer et charger des millions de nouvelles données dans de nouveaux formats dans un cube OLAP peut être aussi complexe qu’un puzzle ou un Rubik’s cube.
Cependant, l’approche ELT, extract, load and transform, promet d'aider à résoudre certains des problèmes liés à l'entreposage de grand volume de données.
Les différences entre ces deux processus ne se limitent pas à l'ordre dans lequel vous exécutez les étapes.
L'étape de transformation est de loin l'étape la plus complexe du processus ETL. L'ETL et les ELT diffèrent donc sur deux points principaux :
Dans un entrepôt de données traditionnel, les données sont d'abord extraites des "systèmes sources" (systèmes ERP, systèmes CRM, etc…). Les outils OLAP et les requêtes SQL dépendent de la standardisation des dimensions des ensembles de données pour obtenir des résultats agrégés. Cela signifie que les données doivent subir une série de transformations.
Traditionnellement, ces transformations ont été effectuées avant le chargement des données dans le système cible, généralement un entrepôt de données relationnel.
Cependant, à mesure que les technologies sous-jacentes de stockage et de traitement des données qui sous-tendent l'entreposage des données évoluent, il est devenu possible d'effectuer des transformations au sein du système cible.
Les processus ETL et ELT impliquent tous deux des zones de transit. Dans ETL, ces zones se trouvent dans l'outil, qu'il soit propriétaire ou personnalisé. Ils se situent entre le système source (par exemple, un système CRM) et le système cible (l'entrepôt de données).
En revanche, avec les ELT, la zone de préparation se trouve dans l'entrepôt de données, et le moteur de base de données qui alimente le SGBD effectue les transformations, par opposition à un outil ETL.
L'une des conséquences immédiates des ELT est que vous perdez les fonctions de préparation et de nettoyage des données que les outils ETL fournissent pour faciliter le processus de transformation des données.
Aussi inoffensif que puisse paraître à première vue le changement de lettres, il est indéniable que les implications architecturales sont considérables pour l'organisation.
Les modèles d'intégration de données ETL et ETL offrent des capacités distinctes qui répondent à des cas d'utilisation différents pour l'entreprise. Alors que l'ETL est le choix traditionnel, l'ELT est plus évolutive, permet de préserver les données à l'état brut et offre une plus grande flexibilité d'utilisation des données dans le temps.
Chaque entreprise aura ses propres besoins et processus. Les ELT ont beaucoup de sens lorsqu'une entreprise a besoin de traiter de grands volumes de données, alors que les ETL sont parfaitement acceptables pour des plus petites quantités de données.
Les technologies émergentes et l’automatisation imprègnent tous les aspects de notre travail et de notre vie d’aujourd’hui.
La véritable opportunité de ces technologies, qui incluent l’intelligence artificielle (IA), le machine learning, l’Internet des Objets (IoT) et les interfacent humaines, est de nous permettre d’adopter l’innovation à une échelle jamais vue auparavant.
Ces technologies nous aident à réimaginer ce qu’il est possible de faire au travail et dans la vie : des voitures à la médecine personnalisée à l’agriculture de précision et aux villes intelligentes qui changent notre façon de vivre notre monde.