Características de MySQL HeatWave Lakehouse

Motor de consultas unificado para cargas de trabajo de MySQL y no de MySQL

Consulta de datos en el almacenamiento de objetos en varios formatos de archivo, como CSV, Parquet, Avro, exportación de archivos de otras bases de datos, datos transaccionales en bases de datos MySQL o una combinación con sintaxis SQL estándar. Los datos no se copian en la base de datos MySQL. En su lugar, el procesamiento de consultas se realiza por completo en el motor HeatWave, de modo que puedes utilizar HeatWave indistintamente para cargas de trabajo que no sean MySQL y cargas de trabajo compatibles con MySQL. Cuando se cargan en el clúster HeatWave, independientemente del origen, los datos se transforman automáticamente en un único formato interno optimizado. De esta forma, la consulta de datos en el almacenamiento de objetos es igual de rápida que en las bases de datos: una prioridad para el sector.

Arquitectura con escalabilidad horizontal

El rendimiento inigualable de Oracle MySQL HeatWave se debe a su arquitectura con escalabilidad horizontal, que permite un paralelismo masivo para aprovisionar el clúster, cargar datos y procesar consultas hasta con 512 nodos. Cada nodo de HeatWave de un clúster y cada núcleo de un nodo puede procesar datos particionados en paralelo, incluidas búsquedas en paralelo, combinaciones, cláusula "group-by", agregación y procesamiento de consultas "top-k". Los algoritmos están diseñados para solapar el tiempo de computación con la comunicación de datos entre nodos, lo cual ayuda a lograr una elevada escalabilidad.

Automatización basada en aprendizaje automático con MySQL Autopilot

MySQL Autopilot proporciona automatización adaptada a las cargas de trabajo para MySQL HeatWave con tecnología de aprendizaje automático. Las capacidades de MySQL Autopilot, como el aprovisionamiento automático, la mejora automática del plan de consulta (que aprende varias estadísticas de tiempo de ejecución de consultas anteriores para mejorar el plan de ejecución en consultas futuras) y la carga paralela automática, se han mejorado para MySQL HeatWave Lakehouse. Entre las capacidades adicionales de HeatWave Lakehouse se incluyen las siguientes:

  • La inferencia automática de esquema infiere automáticamente la asignación de datos de archivos a la definición de esquema correspondiente para todos los tipos de archivo compatibles, incluidos los archivos CSV. Como resultado, no necesitas definir y actualizar manualmente la asignación de esquemas de los archivos, lo que ahorra tiempo y esfuerzo.
  • El muestreo de datos adaptativo selecciona inteligentemente los archivos en el almacenamiento de objetos para obtener la información que facilita las predicciones de automatización de MySQL Autopilot. Mediante el muestreo de datos adaptativo, MySQL Autopilot puede escanear y hacer predicciones, como la asignación de esquema en un archivo de 400 TB en menos de un minuto.
  • El flujo de datos adaptativo permite que MySQL HeatWave Lakehouse se adapte dinámicamente al rendimiento del almacenamiento de objetos subyacente en cualquier región para mejorar el rendimiento general y la disponibilidad.
  • La optimización de consultas adaptativa utiliza diversas estadísticas para ajustar las estructuras de datos y los recursos del sistema después del inicio de la ejecución de la consulta, optimizando independientemente la ejecución de la consulta para cada nodo según la distribución de datos real en tiempo de ejecución. Esto ayuda a mejorar el rendimiento de las consultas ad hoc hasta en un 25 %.

Machine learning integrado

Con HeatWave AutoML, puedes utilizar datos en el almacenamiento de objetos, la base de datos o ambos para crear, entrenar, desplegar y explicar modelos de aprendizaje automático. No es necesario mover los datos a un servicio en la nube de aprendizaje automático independiente ni ser experto en ML. HeatWave AutoML automatiza el pipeline de aprendizaje automático, incluida la selección de algoritmos, el muestreo inteligente de datos para el entrenamiento de modelos, la selección de funciones y la optimización de hiperparámetros, lo que permite ahorrar mucho tiempo y esfuerzo a los analistas y científicos de datos. HeatWave AutoML admite detección de anomalías, previsión, clasificación, regresión y tareas del sistema de recomendaciones. Puedes utilizar HeatWave AutoML sin costo adicional.

IA generativa con el almacén de vectores MySQL HeatWave

Mediante modelos de lenguaje grandes (LLM), las aplicaciones pueden interactuar con HeatWave Lakehouse en lenguaje natural. Actualmente en vista previa privada, el almacén vectorial te permitirá aprovechar el poder de los LLM en combinación con tus datos propios para obtener respuestas más pertinentes y precisas que las derivadas de modelos entrenados solo con datos públicos. Con capacidades de inteligencia artificial generativa y almacén de vectores, podrás interactuar con MySQL HeatWave en lenguaje natural y buscar eficientemente documentos en varios formatos de archivo en HeatWave Lakehouse.

Servicio de base de datos de alta disponibilidad y totalmente gestionado

Tareas como la gestión de alta disponibilidad, la aplicación de parches, las actualizaciones y las copias de seguridad se automatizan con un servicio de base de datos totalmente gestionado. Los datos cargados en el clúster HeatWave se recuperan automáticamente en caso de fallo inesperado del nodo de procesamiento, sin volver a transformar formatos de datos externos.

Control de acceso seguro

Con mecanismos de control de acceso como la autenticación principal de recursos de Oracle Cloud Infrastructure o solicitudes autenticadas previamente, puedes tener control total sobre el acceso a los orígenes del data lake. Al ejecutar HeatWave Lakehouse en AWS, puedes definir roles y políticas de gestión de identidad y acceso para otorgar acceso solo a datos S3 específicos.