HeatWave GenAI

O Oracle HeatWave GenAI fornece IA generativa integrada e automatizada com modelos de linguagem grande (LLMs) no banco de dados; um armazenamento de vetores automatizado no banco de dados; processamento de vetores em escala ampliada; e a capacidade de ter conversas contextuais em linguagem natural, permitindo que você aproveite os benefícios da IA generativa sem conhecimento especializado, movimentação de dados ou custo adicional.

Assista à demonstração (5:40)

Não perca a palestra do Oracle CloudWorld por Edward Screven, arquiteto corporativo chefe da Oracle, em 11 de setembro às 8h30, Horário do Pacífico. “Crie Aplicações de IA Generativa - Integradas e Automatizadas com o HeatWave GenAI.”

Por que usar o HeatWave GenAI?

  • Use a IA generativa rapidamente em qualquer lugar

    Use LLMs otimizados no banco de dados em nuvens e regiões para ajudar a recuperar dados e gerar ou resumir conteúdo, sem o incômodo da seleção e integração de LLMs externos.

  • Obtenha respostas mais precisas e relevantes de forma fácil

    Permita que os LLMs pesquisem seus documentos proprietários para ajudar a obter respostas mais precisas e contextualmente relevantes, sem conhecimento de IA ou transferência de dados para um banco de dados vetorial separado. O HeatWave GenAI automatiza a geração de incorporação.

  • Converse em linguagem natural

    Obtenha insights rápidos de seus documentos por meio de conversas em linguagem natural. A interface do HeatWave Chat preserva o contexto para ajudar a permitir conversas semelhantes às humanas com perguntas para acompanhamento.

Principais recursos do HeatWave GenAI

LLMs no banco de dados

Use os LLMs integrados e otimizados em todas as regiões da Oracle Cloud Infrastructure (OCI), OCI Dedicated Region e entre nuvens e obtenha resultados consistentes com desempenho previsível em todas as implementações. Ajude a reduzir os custos de infraestrutura eliminando a necessidade de provisionar GPUs.

Integrado à OCI Generative AI

Acesse modelos básicos pré-treinados da Cohere e da Meta por meio do serviço OCI Generative AI.

HeatWave Chat

Tenha conversas contextuais em linguagem natural informadas por seus dados não estruturados no HeatWave Vector Store. Use o Lakehouse Navigator integrado para ajudar a orientar os LLMs a pesquisar documentos específicos, ajudando a reduzir custos e obter resultados mais precisos com mais rapidez.

Armazenamento de vetores no banco de dados

O HeatWave Vector Store armazena seus documentos proprietários em vários formatos, atuando como a base de conhecimento para a geração aumentada de recuperação (RAG) para ajudar a obter respostas mais precisas e contextualmente relevantes, sem mover os dados para um banco de dados vetorial separado.

Geração automatizada de incorporações

Aproveite o pipeline automatizado para ajudar a descobrir e ingerir documentos proprietários no HeatWave Vector Store, facilitando o uso do armazenamento de vetores por desenvolvedores e analistas sem experiência em IA.

Processamento de vetores escalonável

O processamento vetorial é paralelizado em até 512 nós do cluster HeatWave e executado na largura de banda da memória, ajudando a fornecer resultados rápidos com menos chances de perda de precisão.

Perspectivas do cliente sobre o HeatWave GenAI

  • "O HeatWave GenAI simplifica muito aproveitar a IA generativa. O suporte para LLMs e criação de vetores no banco de dados leva a uma redução significativa da complexidade da aplicação, latência de inferência previsível e, acima de tudo, nenhum custo adicional para usar os LLMs ou criar as incorporações. Essa é realmente a democratização da IA generativa, e acreditamos que resultará na criação de aplicações mais avançadas com o HeatWave GenAI e ganhos significativos em produtividade para nossos clientes."

    —Vijay Sundhar, CEO, SmarterD

  • “Usamos muito o HeatWave AutoML no banco de dados para fazer várias recomendações aos nossos clientes. O suporte do HeatWave para LLMs no banco de dados e armazenamento de vetores no banco de dados é diferenciado, e a capacidade de integrar IA generativa com o AutoML proporciona um maior diferencial para o HeatWave no setor, permitindo oferecer novos tipos de recursos aos nossos clientes. A sinergia com AutoML também melhora o desempenho e a qualidade dos resultados do LLM."

    —Safarath Shafi, CEO, EatEasy

  • “Os LLMs no banco de dados do HeatWave, o armazenamento de vetores no banco de dados, o processamento de vetores na memória escalável e o HeatWave Chat são recursos muito diferenciados da Oracle que democratizam a IA generativa e a tornam muito simples, segura e barata de usar. O uso do HeatWave e do AutoML para nossas necessidades empresariais já transformou nossos negócios de várias maneiras, e a introdução dessa inovação da Oracle provavelmente estimulará o crescimento de uma nova classe de aplicações em que os clientes estão procurando maneiras de aproveitar a IA generativa em seu conteúdo corporativo”.

    —Eric Aguilar, Fundador, Aiwifi

Quem se beneficia do HeatWave GenAI?

  • Os desenvolvedores podem fornecer aplicativos com IA integrada

    Os LLMs integrados e o HeatWave Chat ajudam a fornecer aplicativos pré-configurados para conversas contextuais em linguagem natural. Não há necessidade de LLMs e GPUs externas.

  • Os analistas podem obter novos insights rapidamente

    O HeatWave GenAI pode ajudar você a conversar facilmente com seus dados, realizar pesquisas de similaridade em documentos e recuperar informações de seus dados proprietários.

  • A TI pode ajudar a acelerar a inovação em IA

    Capacite desenvolvedores e equipes de negócios com recursos integrados e automação para aproveitar a IA generativa. Habilite facilmente conversas em linguagem natural e RAG.

Você pode usar os LLMs no banco de dados para ajudar a gerar ou resumir o conteúdo com base em documentos não estruturados. Os usuários podem fazer perguntas em linguagem natural por meio de aplicações, e o LLM processará a solicitação e entregará o conteúdo.


Diagrama de geração de conteúdo, descrição abaixo:

Um usuário está fazendo uma pergunta em linguagem natural: “Você pode gerar um resumo deste briefing da solução?”. O grande modelo de linguagem (LLM) processa essa entrada e gera o resumo como saída.



Combine o poder da IA generativa com outros recursos integrados do HeatWave, como o machine learning, para ajudar a reduzir custos e obter resultados mais precisos com mais rapidez. Neste exemplo, uma empresa de manufatura faz isso para manutenção preditiva. Os engenheiros podem usar o Oracle HeatWave AutoML para ajudar a gerar automaticamente um relatório de logs de produção anômalos e o HeatWave GenAI ajuda a determinar rapidamente a causa raiz do problema simplesmente fazendo uma pergunta em linguagem natural, em vez de analisar manualmente os logs.


Diagrama de geração de análise, descrição abaixo:

Um usuário pergunta via HeatWave Chat “Qual é o maior problema deste conjunto de logs? Forneça um resumo em duas frases.". Primeiro, o HeatWave AutoML produz uma lista filtrada de logs anômalos com base em todos os logs de produção que ele ingere continuamente. Em seguida, o HeatWave Vector Store fornece contexto adicional ao LLM de acordo com a base de conhecimento de logs. O LLM usa esse prompt aumentado, produz um relatório e fornece ao usuário uma resposta detalhada explicando o problema em linguagem natural.



Os chatbots podem usar o RAG para, por exemplo, ajudar a responder às perguntas dos funcionários sobre as políticas internas da empresa. Os documentos internos que detalham as políticas são armazenados como incorporações no HeatWave Vector Store. Para uma determinada consulta do usuário, o armazenamento de vetores ajuda a identificar os documentos mais semelhantes executando uma pesquisa de similaridade com as incorporações armazenadas. Esses documentos são usados para aumentar o prompt dado ao LLM para que ele forneça uma resposta precisa.


Diagrama do RAG, descrição abaixo:

Um usuário pergunta via HeatWave Chat “Quais laptops posso encomendar e qual é o processo?”. O HeatWave processa a questão acessando documentos de política interna armazenados no HeatWave Vector Store. Em seguida, ele fornece um prompt aumentado para o LLM que pode gerar a resposta “Aqui está a lista de fornecedores aprovados e as etapas a serem seguidas para fazer o pedido”.



Os desenvolvedores podem criar aplicações aproveitando o poder combinado do machine learning integrado, da IA generativa e do armazenamento de vetores para fornecer recomendações personalizadas. Neste exemplo, a aplicação usa o sistema de recomendação HeatWave AutoML para recomendar restaurantes com base nas preferências do usuário ou no que ele pediu anteriormente. Com o HeatWave Vector Store, a aplicação também pode pesquisar os cardápios dos restaurantes em formato PDF para sugerir pratos específicos, proporcionando maior valor aos clientes.


RAG aprimorado com diagrama ML, descrição abaixo:

Um usuário pergunta via HeatWave Chat “Quais pratos veganos você sugere para mim hoje?”. Primeiro, o sistema de recomendação HeatWave AutoML sugere uma lista de restaurantes com base no que o usuário já pediu anteriormente. Em seguida, o HeatWave Vector Store fornece um prompt aumentado para o LLM com base nos menus dos restaurantes que ele abriga. O LLM pode então gerar uma recomendação personalizada de pratos em linguagem natural.



26 DE JUNHO DE 2024

Anuncio da disponibilidade geral do HeatWave GenAI

Nipun Agarwal, Vice-Presidente Sênior da Oracle, Desenvolvimento do HeatWave

O HeatWave permitiu que as organizações executassem processamento de transações, análises em data warehouses e data lakes e machine learning em um único serviço de nuvem totalmente gerenciado. Hoje estamos anunciando a disponibilidade geral do HeatWave GenAI, com grandes modelos de linguagem (LLMs) no banco de dados, um armazenamento automatizado de vetores no banco de dados, processamento de vetores escalonável e a capacidade de ter conversas contextuais em linguagem natural.

Leia a publicação completa

Veja o que os principais analistas do setor dizem sobre o HeatWave GenAI

  • Logotipo da NAND Research

    “Com LLMs no banco de dados prontos para uso e um armazenamento de vetores totalmente automatizado pronto para o processamento de vetores desde o primeiro dia, o HeatWave GenAI leva a simplicidade da IA (e a economia) a um nível que seus concorrentes não chegam nem perto.”

    Steve McDowell
    Analista Principal e Sócio Fundador, NAND Research
  • Logotipo da Constellation Research

    “A inovação de engenharia do HeatWave continua oferecendo a visão de um banco de dados em nuvem universal. A mais recente é a IA generativa feita no "estilo HeatWave", que inclui a integração de um armazenamento vetorial automatizado no banco de dados e LLMs no banco de dados diretamente no núcleo do HeatWave. Isso permite que os desenvolvedores gerem novas classes de aplicações ao combinar elementos do HeatWave.”

    Holger Mueller
    Vice-Presidente e Analista Principal, Constellation Research
  • Logotipo do Futurum Group

    “O HeatWave GenAI forneceu um desempenho de processamento vetorial 30 vezes mais rápido que o Snowflake, 18 vezes mais rápido que o Google BigQuery e 15 vezes mais rápido que o Databricks, com um custo até 6 vezes menor. Para qualquer organização que leve a sério as cargas de trabalho de IA generativa de alto desempenho, investir os recursos da empresa em qualquer uma dessas três ou em outras ofertas de banco de dados vetorial é o equivalente a jogar dinheiro fora e tentar justificar afirmando que é uma boa ideia.”

    Ron Westfall
    Analista Sênior e Diretor de Pesquisa, The Futurum Group
  • Logotipo da dbInsight

    “O HeatWave está dando um grande passo para tornar a IA generativa e a geração aumentada de recuperação (RAG) mais acessíveis, deixando toda a complexidade da criação de incorporações de vetores nos bastidores. Os desenvolvedores simplesmente apontam para os arquivos de origem que estão no armazenamento de objetos na nuvem, e o HeatWave faz o trabalho pesado.”

    Tony Baer
    Fundador e CEO, dbInsight

Introdução ao HeatWave GenAI

Crie aplicações de GenAI com facilidade

Siga as instruções passo a passo e use o código que fornecemos para criar aplicações com tecnologia HeatWave GenAI de forma rápida e fácil.

Inscreva-se para o serviço

Inscreva-se para obter uma avaliação gratuita do HeatWave GenAI. Você receberá US$ 300 em crédito na nuvem para experimentar os recursos por 30 dias.

Fale com um especialista

Deseja aprender mais sobre o HeatWave GenAI? Deixe um de nossos especialistas ajudar.