HeatWave GenAI

Oracle HeatWave GenAI proporciona IA generativa integrada y automatizada con modelos de lenguaje de gran tamaño (LLM) en la base de datos; un almacén de vectores automatizado y en la base de datos; procesamiento de vectores a escala; y la capacidad de mantener conversaciones contextuales en lenguaje natural, lo que le permite aprovechar las ventajas de la IA generativa sin conocimientos de IA, movimiento de datos ni costos adicionales.

Mira la demostración (5:40)

No te pierdas la presentación de Oracle CloudWorld de Edward Screven, arquitecto corporativo jefe de Oracle, el 11 de septiembre a las 8:30 a. m. PT: "Desarrollo de aplicaciones de IA generativa: integradas y automatizadas con HeatWave GenAI".

¿Por qué utilizar HeatWave GenAI?

  • Utiliza rápidamente la IA generativa en cualquier lugar

    Emplea LLM optimizados en la base de datos, en todas las nubes y regiones, para ayudar a recuperar datos y generar o resumir contenidos, sin las molestias de la selección e integración de LLM externos.

  • Obtén fácilmente respuestas más precisas y relevantes

    Deja que los LLM busquen en tus documentos patentados para obtener respuestas más precisas y contextualmente relevantes, sin necesidad de conocimientos de IA ni de trasladar los datos a una base de datos vectorial independiente. HeatWave GenAI automatiza la generación de incrustación.

  • Conversa en lenguaje natural

    Obtén información rápida de tus documentos a través de conversaciones en lenguaje natural. La interfaz de chat HeatWave conserva el contexto a fin de activar conversaciones similares a las humanas con preguntas de seguimiento.

Funciones clave de HeatWave GenAI

LLM en la base de datos

Utiliza los LLM optimizados incorporados en todas las regiones de Oracle Cloud Infrastructure (OCI), OCI Dedicated Region y entre nubes; y obtén resultados consistentes con un rendimiento predecible en todos los despliegues. Ayuda a reducir los costos de infraestructura al eliminar la necesidad de aprovisionar GPU.

Integrado con OCI Generative AI

Accede a modelos básicos preentrenados de Cohere y Meta a través del servicio OCI Generative AI.

HeatWave Chat

Mantén conversaciones contextuales en lenguaje natural informadas por tus datos no estructurados en HeatWave Vector Store. Utiliza el Lakehouse Navigator integrado para guiar a los LLM a buscar en conjuntos de datos específicos, ayudándote a reducir costos mientras obtienes resultados más precisos más rápido.

Almacenamiento de vectores en la base de datos

HeatWave Vector Store aloja tus documentos de propiedad en varios formatos, actuando como base de conocimientos para la generación aumentada de recuperación (RAG) a fin de ayudarte a obtener respuestas más precisas y contextualmente relevantes, sin necesidad de trasladar los datos a una base de datos vectorial independiente.

Generación automatizada de embeddings

Aprovecha el pipeline automatizado para ayudar a descubrir e ingerir documentos propios en HeatWave Vector Store, facilitando a los desarrolladores y analistas sin experiencia en IA el uso del almacenamiento de vectores.

Procesamiento de vectores a escala

El procesamiento de vectores se paraleliza en hasta 512 nodos de clúster HeatWave y se ejecuta a ancho de banda de memoria, ayudando a entregar resultados rápidos con una menor probabilidad de pérdida de precisión.

Perspectivas de los clientes sobre HeatWave GenAI

  • "HeatWave GenAI hace que sea extremadamente fácil aprovechar la IA generativa. El soporte de los LLM en la base de datos y la creación de vectores en la base de datos conlleva una reducción significativa de la complejidad de la aplicación, una latencia de inferencia predecible y, sobre todo, ningún costo adicional para nosotros por utilizar los LLM o crear las incrustaciones. Esta es realmente la democratización de la IA generativa, y creemos que resultará en la creación de aplicaciones más ricas con HeatWave GenAI y ganancias significativas en productividad para nuestros clientes".

    —Vijay Sundhar, CEO, SmarterD

  • "Utilizamos en gran medida HeatWave AutoML en la base de datos para hacer varias recomendaciones a nuestros clientes. El soporte de HeatWave para LLM en la base de datos y el almacén de vectores en la base de datos es diferenciado y la capacidad de integrar la IA generativa con AutoML proporciona una mayor diferenciación para HeatWave en el sector, lo que nos permite ofrecer nuevos tipos de capacidades a nuestros clientes. La sinergia con AutoML también mejora el dersempeño y la calidad de los resultados de LLM".

    —Safarath Shafi, CEO, EatEasy

  • «Los LLM de HeatWave en la base de datos, el almacén de vectores en la base de datos, el procesamiento de vectores en memoria escalable y HeatWave Chat son capacidades muy diferenciadas de Oracle que democratizan la IA generativa y la hacen muy sencilla, segura y económica de utilizar. El uso de HeatWave y AutoML para nuestras necesidades empresariales ha transformado nuestra empresa de varias maneras, y la introducción de esta innovación de Oracle probablemente estimulará el crecimiento de una nueva clase de aplicaciones en las que los clientes buscan formas de aprovechar la IA generativa en sus contenidos empresariales.»

    —Eric Aguilar, fundador, Aiwifi

¿Quién se beneficia de HeatWave GenAI?

  • Los desarrolladores pueden entregar aplicaciones con IA integrada

    Los LLM incorporados y el chat HeatWave permiten ofrecer aplicaciones preconfiguradas para conversaciones contextuales en lenguaje natural. No es necesario utilizar LLM ni GPU externos.

  • Los analistas pueden obtener rápidamente nuevas estadísticas

    HeatWave GenAI puede ayudarte a conversar fácilmente con tus datos, realizar búsquedas de similitud entre documentos y recuperar información de tus datos propietarios.

  • TI ayuda a acelerar la innovación en IA

    Capacita a los desarrolladores y equipos empresariales con capacidades integradas y automatización para aprovechar la IA generativa. Activa fácilmente conversaciones en lenguaje natural y RAG.

Puedes utilizar los LLM en la base de datos para ayudar a generar o resumir contenido basado en documentos no estructurados. Los usuarios pueden plantear preguntas en lenguaje natural a través de aplicaciones, y el LLM procesará la solicitud y entregará el contenido.


Diagrama de generación de contenido, descripción a continuación:

Un usuario hace una pregunta en lenguaje natural "¿Puedes generar un resumen de esta solución?". El modelo de lenguaje grande (LLM) procesa esta entrada y genera el resumen como salida.



Se puede combinar el poder de la IA generativa con otras capacidades incorporadas de HeatWave, como el aprendizaje automático, para ayudar a reducir costos y obtener resultados más precisos más rápido. En este ejemplo, una empresa de fabricación lo hace para el mantenimiento predictivo. Los ingenieros pueden utilizar Oracle HeatWave AutoML para ayudar a elaborar automáticamente un informe de los registros de producción anómalos y HeatWave GenAI ayuda a determinar rápidamente la causa raíz del problema simplemente formulando una pregunta en lenguaje natural, en lugar de analizar manualmente los registros.


Diagrama de generación de contenido, descripción a continuación:

Un usuario pregunta a través de HeatWave Chat "¿Cuál es el principal problema en esta recopilación de logs? Proporciona un resumen de dos frases." En primer lugar, HeatWave AutoML produce una lista filtrada de logs anómalos basada en todos los logs de producción que ingiere continuamente. A continuación, HeatWave Vector Store proporciona contexto adicional al LLM basado en la base de conocimientos de logs. El LLM toma esa petición de datos aumentada, elabora un informe y proporciona al usuario una respuesta detallada que explica el problema en lenguaje natural.



Los chatbots pueden utilizar RAG para, por ejemplo, ayudar a responder a las preguntas de los empleados sobre las políticas internas de la empresa. Los documentos internos que detallan las políticas se almacenan como incrustaciones en HeatWave Vector Store. Para una consulta de usuario determinada, el almacén vectorial ayuda a identificar los documentos más similares realizando una búsqueda de similitudes con las incrustaciones almacenadas Estos documentos se utilizan para aumentar la pregunta dada al LLM de modo que proporcione una respuesta más contextual.


Diagrama RAG, descripción a continuación:

Un usuario pregunta a través de HeatWave Chat "¿Qué portátiles puedo pedir y cuál es el proceso?". HeatWave procesa la pregunta accediendo a los documentos de políticas internas alojados en HeatWave Vector Store. A continuación, proporciona una petición de datos aumentada al LLM que puede generar la respuesta "Aquí está la lista de proveedores aprobados y los pasos a seguir para ordenar".



Los desarrolladores pueden desarrollar aplicaciones aprovechando la potencia combinada del aprendizaje automático integrado, la IA generativa y el almacén de vectores para ofrecer recomendaciones personalizadas. En este ejemplo, la aplicación utiliza el sistema de recomendación HeatWave AutoML para recomendar restaurantes en función de las preferencias del usuario o del pedido anterior del usuario. Con HeatWave Vector Store, también puede buscar a través de los menús de los restaurantes en formato PDF para sugerir platos específicos a los clientes.


RAG mejorado con diagrama de aprendizaje automático, descripción a continuación:

Un usuario pregunta a través de HeatWave Chat "¿Qué platos veganos me sugieres hoy?". En primer lugar, el sistema de recomendación HeatWave AutoML sugiere una lista de restaurantes en función de lo que el usuario solicitó anteriormente. A continuación, HeatWave Vector Store proporciona un aviso aumentado al LLM basado en los menús de los restaurantes que alberga. El LLM puede generar una recomendación personalizada de platos en lenguaje natural.



26 DE JUNIO DE 2024

Anuncio de la disponibilidad general de HeatWave GenAI

Nipun Agarwal, vicepresidente sénior, desarrollo de HeatWave HeatWave

HeatWave ha permitido a las organizaciones ejecutar el procesamiento de transacciones, analítica en almacenes de datos y lagos de datos, y aprendizaje automático en un único servicio en la nube totalmente gestionado. Hoy anunciamos la disponibilidad general de HeatWave GenAI, con modelos de lenguaje grandes (LLM) y una tienda de vectores automatizada en la base de datos; procesamiento de vectores de escala horizontal; y la capacidad de tener conversaciones contextuales en lenguaje natural.

Lee el post completo

Mira lo que opinan algunos de los mejores analistas del sector sobre HeatWave GenAI

  • Logotipo de NAND Research

    "Gracias a los LLM en la base de datos que están listos para funcionar y una tienda vectorial totalmente automatizada que está lista para el procesamiento de vectores el primer día, HeatWave GenAI lleva la simplicidad de la IA, y el rendimiento de precios, a un nivel que sus competidores como Snowflake, Google BigQuery y Databricks no pueden comenzar a abordar de forma remota."

    Steve McDowell
    Analista principal y socio fundador, NAND Research
  • Logotipo de Constellation Research

    "La innovación en ingeniería de HeatWave sigue cumpliendo la visión de una base de datos universal en la nube. La última es la IA generativa 'estilo HeatWave', que incluye la integración de un almacén de vectores automatizado en la base de datos y LLM en la base de datos directamente en el núcleo HeatWave. Esto permite a los desarrolladores crear nuevas clases de aplicaciones a medida que combinan elementos HeatWave".

    Holger Mueller
    vicepresidente y analista principal, Constellation Research
  • Logotipo de Futurum Group

    "HeatWave GenAI ha proporcionado un rendimiento de procesamiento vectorial que es 30X más rápido que Snowflake, 18X más rápido que Google BigQuery y 15X más rápido que Databricks, con un costo hasta 6X más bajo. Para cualquier organización que se tome en serio las cargas de trabajo de IA generativa de alto rendimiento, gastar recursos de la empresa en cualquiera de estas tres u otras ofertas de bases de datos vectoriales equivale a quemar dinero e intentar justificarlo como una buena idea.»

    Ron Westfall
    Analista sénior y director de investigación, Futurum Group
  • Logotipo de dbInsight

    "HeatWave está dando un gran paso para hacer que la IA generativa y la Generación Aumentada por Recuperación (RAG) sean más accesibles al empujar toda la complejidad de crear incrustaciones de vectores bajo el capó. Los desarrolladores simplemente apuntan a los archivos de origen que se encuentran en el almacenamiento de objetos en la nube y, a continuación, HeatWave maneja la migración pesada".

    Tony Baer
    Fundadot y CEO, dbInsight

Comienza a utilizar HeatWave GenAI

Accede a la documentación

Desarrolla fácilmente aplicaciones GenAI

Sigue las instrucciones paso a paso y utiliza el código que proporcionamos para crear de forma rápida y sencilla aplicaciones con tecnología HeatWave GenAI.

Regístrate en el servicio

Regístrate para una prueba gratuita de HeatWave MySQL. Obtendrás 300 dólares en crédito en la nube para probar HeatWave MySQL durante 30 días.

Ponte en contacto con ventas

¿Te interesa en aprender más sobre HeatWave MySQL? Permite que uno de nuestros expertos te ayude.