ELT versus ETL

Extract, Transform, and Load (ETL) est le processus le plus utilisé pour l'entreposage et l'analyse des données. Plus récemment, cependant, une autre approche, Extract, Load, and Transform (ELT), a pris de l'ampleur et adopte un style différent et plus moderne pour le traitement des données.

Téléchargez le Livre Blanc : Oracle Autonomous Database pour les nuls

17 au 19 Septembre : Webinar Oracle Technology Data Week

Quelle difference entre ELT et ETL ?

Temps de lecture : 4 mn

Au cours de la dernière décennie, il y a eu une explosion de nouveaux types de données : Big Data, des données provenant des réseaux sociaux, des capteurs, etc. Cette multiplication de type et de volume de données a mis à rude épreuve l'architecture du Data Warehouse.

L'utilisation d'un processus traditionnel ETL pour extraire, transformer et charger des millions de nouvelles données dans de nouveaux formats dans un cube OLAP peut être aussi complexe qu’un puzzle ou un Rubik’s cube.

Cependant, l’approche ELT, extract, load and transform, promet d'aider à résoudre certains des problèmes liés à l'entreposage de grand volume de données.

Les différences entre ces deux processus ne se limitent pas à l'ordre dans lequel vous exécutez les étapes.

ELT ou ETL : Quelle est la différence ?

L'étape de transformation est de loin l'étape la plus complexe du processus ETL. L'ETL et les ELT diffèrent donc sur deux points principaux :

  • Le moment où la transformation est effectuée
  • Le lieu de la transformation

Dans un entrepôt de données traditionnel, les données sont d'abord extraites des "systèmes sources" (systèmes ERP, systèmes CRM, etc…). Les outils OLAP et les requêtes SQL dépendent de la standardisation des dimensions des ensembles de données pour obtenir des résultats agrégés. Cela signifie que les données doivent subir une série de transformations.

Traditionnellement, ces transformations ont été effectuées avant le chargement des données dans le système cible, généralement un entrepôt de données relationnel.

Cependant, à mesure que les technologies sous-jacentes de stockage et de traitement des données qui sous-tendent l'entreposage des données évoluent, il est devenu possible d'effectuer des transformations au sein du système cible.

Les processus ETL et ELT impliquent tous deux des zones de transit. Dans ETL, ces zones se trouvent dans l'outil, qu'il soit propriétaire ou personnalisé. Ils se situent entre le système source (par exemple, un système CRM) et le système cible (l'entrepôt de données).

En revanche, avec les ELT, la zone de préparation se trouve dans l'entrepôt de données, et le moteur de base de données qui alimente le SGBD effectue les transformations, par opposition à un outil ETL.

L'une des conséquences immédiates des ELT est que vous perdez les fonctions de préparation et de nettoyage des données que les outils ETL fournissent pour faciliter le processus de transformation des données.

ELT ou ETL : Comment déterminer ce qui vous correspond ?

Aussi inoffensif que puisse paraître à première vue le changement de lettres, il est indéniable que les implications architecturales sont considérables pour l'organisation.

Les modèles d'intégration de données ETL et ETL offrent des capacités distinctes qui répondent à des cas d'utilisation différents pour l'entreprise. Alors que l'ETL est le choix traditionnel, l'ELT est plus évolutive, permet de préserver les données à l'état brut et offre une plus grande flexibilité d'utilisation des données dans le temps.

Chaque entreprise aura ses propres besoins et processus. Les ELT ont beaucoup de sens lorsqu'une entreprise a besoin de traiter de grands volumes de données, alors que les ETL sont parfaitement acceptables pour des plus petites quantités de données.

Comment la gestion autonome des bases de données aide les entreprises à être plus efficace et plus innovantes ?

Ce guide complet donne un aperçu détaillé sur la façon dont Oracle Autonomous Database permet aux entreprises d’optimiser la gestion de leur base de données. Ce guide décrit également comment Autonomous Database permet de capitaliser sur les technologies émergentes (machine learning et IA) pour créer de nouvelles applications et exploiter la valeur de leurs données.