Fonctionnalités de MySQL HeatWave Lakehouse

Moteur de requête unifié pour les workloads MySQL et non-MySQL

Interrogez des données dans le stockage d'objets dans différents formats de fichier tels que CSV, Parquet, Avro, exportez des fichiers à partir d'autres bases de données, des données transactionnelles dans des bases de données MySQL ou une combinaison utilisant la syntaxe SQL standard. Les données ne sont pas copiées dans la base de données MySQL. Au lieu de cela, le traitement des requêtes est entièrement effectué dans le moteur HeatWave, de sorte que vous pouvez utiliser HeatWave pour les workloads non MySQL et les workloads compatibles MySQL. Une fois chargées dans le cluster HeatWave, les données de toutes les sources sont automatiquement transformées en un seul format interne optimisé. Par conséquent, les requêtes des données dans le stockage d'objets sont traitées aussi rapidement que dans les bases de données. C'est une première.

Architecture évolutive

Les performances inégalées d'Oracle MySQL HeatWave sont le résultat de son architecture évolutive, qui permet un parallélisme massif pour provisionner les clusters, charger les données et traiter les requêtes avec jusqu'à 512 nœuds. Chaque nœud de HeatWave au sein d'un cluster et chaque cœur au sein d'un nœud peut traiter des données partitionnées en parallèle, dont des scans parallèles, des jointures, le regroupement, l'agrégation et le traitement top-k. Les algorithmes sont conçus pour faire se chevaucher la durée de calcul et la communication des données entre les nœuds, ce qui permet d'atteindre une évolutivité élevée.

Automatisation grâce au machine learning avec MySQL Autopilot

MySQL Autopilot fournit une automatisation tenant compte des workloads pour MySQL HeatWave optimisée par le machine learning (ML). Les fonctionnalités de MySQL Autopilot, telles que le provisionnement automatique, l'amélioration du plan de requête automatique (qui apprend diverses statistiques d'exécution à partir des exécutions de requêtes passées pour améliorer le plan d'exécution des requêtes futures) et le chargement en parallèle automatique, ont été améliorées pour MySQL HeatWave Lakehouse. Les fonctionnalités supplémentaires pour HeatWave Lakehouse sont les suivantes :

  • L'inférence de schéma automatique déduit automatiquement la correspondance entre les données de fichier et la définition de schéma concerné pour tous les types de fichier pris en charge, y compris CSV. Par conséquent, vous ne devez pas définir et mettre à jour manuellement le mappage de schéma des fichiers, ce qui vous fait gagner du temps et réaliser des économies.
  • L'échantillonnage adaptatif des données échantillonne intelligemment les fichiers dans le stockage d'objets pour dériver les informations qui rendent possibles les prévisions d'automatisation de MySQL Autopilot. Grâce à l'échantillonnage adaptatif des données, MySQL Autopilot peut analyser et effectuer des prédictions, telles que le mappage de schéma sur un fichier de 400 To en moins d'une minute.
  • Le flux de données adaptatif permet à MySQL HeatWave Lakehouse de s'adapter dynamiquement aux performances du dépôt d'objets sous-jacent dans toutes les régions afin d'améliorer les performances globales et la disponibilité.
  • L'optimisation adaptative des requêtes utilise diverses statistiques pour ajuster les structures de données et les ressources système après le démarrage de l'exécution des requêtes, optimisant de manière indépendante l'exécution des requêtes pour chaque nœud en fonction de la répartition réelle des données lors de l'exécution. Cela permet d'améliorer les performances des requêtes ad hoc jusqu'à 25 %.

Machine Learning intégré

Avec HeatWave AutoML, vous pouvez utiliser des données dans le stockage d'objets, la base de données ou les deux pour créer, entraîner, déployer et expliquer des modèles de machine learning. Vous n'avez pas besoin de déplacer les données vers un service cloud de machine learning distinct, ni d'être un expert en machine learning. HeatWave AutoML automatise le pipeline de machine learning, notamment la sélection d'algorithmes, l'échantillonnage intelligent des données pour l'entraînement de modèle, la sélection des caractéristiques et l'optimisation des hyperparamètres. Les data analysts gagnent ainsi du temps et évitent les tâches chronophages. HeatWave AutoML prend en charge les tâches de détection d'anomalies, de prévision, de classification, de régression et de recommandation, même pour les colonnes de texte. Vous pouvez utiliser HeatWave AutoML sans frais supplémentaires.

IA générative avec banque de vecteurs MySQL HeatWave

À l'aide de grands modèles de langage (LLM), les applications peuvent interagir avec HeatWave Lakehouse en langage naturel. Actuellement en prévisualisation privée, le stockage vectoriel vous permettra de tirer parti de la puissance des LLM en combinaison avec vos données propriétaires pour obtenir des réponses plus pertinentes et précises que celles dérivées de modèles entraînés uniquement sur des données publiques. Grâce à l'IA générative et aux capacités de stockage vectoriel, les clients peuvent interagir avec MySQL HeatWave en langage naturel et rechercher efficacement des documents propriétaires dans différents formats de fichiers dans HeatWave Lakehouse.

Service de base de données entièrement géré et hautement disponible

Des tâches telles que la gestion de la haute disponibilité, l'application de correctifs, les mises à niveau et les sauvegardes sont automatisées avec un service de base de données entièrement géré. Les données chargées dans le cluster HeatWave sont automatiquement récupérées en cas de défaillance inopinée du nœud de calcul, sans retransformation à partir de formats de données externes.

Contrôle d'accès sécurisé

Grâce aux mécanismes de contrôle d'accès tels que l'authentification principale des ressources d'Oracle Cloud Infrastructure (OCI) ou les demandes pré-authentifiées, vous pouvez disposer d'un contrôle total sur l'accès aux sources de data lakes. Lorsque vous exécutez HeatWave Lakehouse dans AWS, vous pouvez définir des rôles et des stratégies de gestion des identités et des accès pour accorder l'accès uniquement à des données S3 spécifiques.