Interrogez des données dans le stockage d'objets dans différents formats de fichier tels que CSV, Parquet, Avro, exportez des fichiers à partir d'autres bases de données, des données transactionnelles dans des bases de données MySQL ou une combinaison utilisant la syntaxe SQL standard. Les données ne sont pas copiées dans la base de données MySQL. Au lieu de cela, le traitement des requêtes est entièrement effectué dans le moteur HeatWave, de sorte que vous pouvez utiliser HeatWave pour les workloads non MySQL et les workloads compatibles MySQL. Une fois chargées dans le cluster HeatWave, les données de toutes les sources sont automatiquement transformées en un seul format interne optimisé. Par conséquent, les requêtes des données dans le stockage d'objets sont traitées aussi rapidement que dans les bases de données. C'est une première.
Les performances inégalées d'Oracle MySQL HeatWave sont le résultat de son architecture évolutive, qui permet un parallélisme massif pour provisionner les clusters, charger les données et traiter les requêtes avec jusqu'à 512 nœuds. Chaque nœud de HeatWave au sein d'un cluster et chaque cœur au sein d'un nœud peut traiter des données partitionnées en parallèle, dont des scans parallèles, des jointures, le regroupement, l'agrégation et le traitement top-k. Les algorithmes sont conçus pour faire se chevaucher la durée de calcul et la communication des données entre les nœuds, ce qui permet d'atteindre une évolutivité élevée.
MySQL Autopilot fournit une automatisation tenant compte des workloads pour MySQL HeatWave optimisée par le machine learning (ML). Les fonctionnalités de MySQL Autopilot, telles que le provisionnement automatique, l'amélioration du plan de requête automatique (qui apprend diverses statistiques d'exécution à partir des exécutions de requêtes passées pour améliorer le plan d'exécution des requêtes futures) et le chargement en parallèle automatique, ont été améliorées pour MySQL HeatWave Lakehouse. Les fonctionnalités supplémentaires pour HeatWave Lakehouse sont les suivantes :
Avec HeatWave AutoML, vous pouvez utiliser des données dans le stockage d'objets, la base de données ou les deux pour créer, entraîner, déployer et expliquer des modèles de machine learning. Vous n'avez pas besoin de déplacer les données vers un service cloud de machine learning distinct, ni d'être un expert en machine learning. HeatWave AutoML automatise le pipeline de machine learning, notamment la sélection d'algorithmes, l'échantillonnage intelligent des données pour l'entraînement de modèle, la sélection des caractéristiques et l'optimisation des hyperparamètres. Les data analysts gagnent ainsi du temps et évitent les tâches chronophages. HeatWave AutoML prend en charge les tâches de détection d'anomalies, de prévision, de classification, de régression et de recommandation, même pour les colonnes de texte. Vous pouvez utiliser HeatWave AutoML sans frais supplémentaires.
À l'aide de grands modèles de langage (LLM), les applications peuvent interagir avec HeatWave Lakehouse en langage naturel. Actuellement en prévisualisation privée, le stockage vectoriel vous permettra de tirer parti de la puissance des LLM en combinaison avec vos données propriétaires pour obtenir des réponses plus pertinentes et précises que celles dérivées de modèles entraînés uniquement sur des données publiques. Grâce à l'IA générative et aux capacités de stockage vectoriel, les clients peuvent interagir avec MySQL HeatWave en langage naturel et rechercher efficacement des documents propriétaires dans différents formats de fichiers dans HeatWave Lakehouse.
Des tâches telles que la gestion de la haute disponibilité, l'application de correctifs, les mises à niveau et les sauvegardes sont automatisées avec un service de base de données entièrement géré. Les données chargées dans le cluster HeatWave sont automatiquement récupérées en cas de défaillance inopinée du nœud de calcul, sans retransformation à partir de formats de données externes.
Grâce aux mécanismes de contrôle d'accès tels que l'authentification principale des ressources d'Oracle Cloud Infrastructure (OCI) ou les demandes pré-authentifiées, vous pouvez disposer d'un contrôle total sur l'accès aux sources de data lakes. Lorsque vous exécutez HeatWave Lakehouse dans AWS, vous pouvez définir des rôles et des stratégies de gestion des identités et des accès pour accorder l'accès uniquement à des données S3 spécifiques.