O Oracle HeatWave GenAI fornece IA generativa integrada e automatizada com modelos de linguagem grande (LLMs) no banco de dados; um armazenamento de vetores automatizado no banco de dados; processamento de vetores em escala ampliada; e a capacidade de ter conversas contextuais em linguagem natural, permitindo que você aproveite os benefícios da IA generativa sem conhecimento especializado, movimentação de dados ou custo adicional.
Não perca a palestra do Oracle CloudWorld por Edward Screven, arquiteto corporativo chefe da Oracle, em 11 de setembro às 8h30, Horário do Pacífico. “Crie Aplicações de IA Generativa - Integradas e Automatizadas com o HeatWave GenAI.”
Use LLMs otimizados no banco de dados em nuvens e regiões para ajudar a recuperar dados e gerar ou resumir conteúdo, sem o incômodo da seleção e integração de LLMs externos.
Permita que os LLMs pesquisem seus documentos proprietários para ajudar a obter respostas mais precisas e contextualmente relevantes, sem conhecimento de IA ou transferência de dados para um banco de dados vetorial separado. O HeatWave GenAI automatiza a geração de incorporação.
Obtenha insights rápidos de seus documentos por meio de conversas em linguagem natural. A interface do HeatWave Chat preserva o contexto para ajudar a permitir conversas semelhantes às humanas com perguntas para acompanhamento.
Use os LLMs integrados e otimizados em todas as regiões da Oracle Cloud Infrastructure (OCI), OCI Dedicated Region e entre nuvens e obtenha resultados consistentes com desempenho previsível em todas as implementações. Ajude a reduzir os custos de infraestrutura eliminando a necessidade de provisionar GPUs.
Acesse modelos básicos pré-treinados da Cohere e da Meta por meio do serviço OCI Generative AI.
Tenha conversas contextuais em linguagem natural informadas por seus dados não estruturados no HeatWave Vector Store. Use o Lakehouse Navigator integrado para ajudar a orientar os LLMs a pesquisar documentos específicos, ajudando a reduzir custos e obter resultados mais precisos com mais rapidez.
O HeatWave Vector Store armazena seus documentos proprietários em vários formatos, atuando como a base de conhecimento para a geração aumentada de recuperação (RAG) para ajudar a obter respostas mais precisas e contextualmente relevantes, sem mover os dados para um banco de dados vetorial separado.
Aproveite o pipeline automatizado para ajudar a descobrir e ingerir documentos proprietários no HeatWave Vector Store, facilitando o uso do armazenamento de vetores por desenvolvedores e analistas sem experiência em IA.
O processamento vetorial é paralelizado em até 512 nós do cluster HeatWave e executado na largura de banda da memória, ajudando a fornecer resultados rápidos com menos chances de perda de precisão.
"O HeatWave GenAI simplifica muito aproveitar a IA generativa. O suporte para LLMs e criação de vetores no banco de dados leva a uma redução significativa da complexidade da aplicação, latência de inferência previsível e, acima de tudo, nenhum custo adicional para usar os LLMs ou criar as incorporações. Essa é realmente a democratização da IA generativa, e acreditamos que resultará na criação de aplicações mais avançadas com o HeatWave GenAI e ganhos significativos em produtividade para nossos clientes."
—Vijay Sundhar, CEO, SmarterD
“Usamos muito o HeatWave AutoML no banco de dados para fazer várias recomendações aos nossos clientes. O suporte do HeatWave para LLMs no banco de dados e armazenamento de vetores no banco de dados é diferenciado, e a capacidade de integrar IA generativa com o AutoML proporciona um maior diferencial para o HeatWave no setor, permitindo oferecer novos tipos de recursos aos nossos clientes. A sinergia com AutoML também melhora o desempenho e a qualidade dos resultados do LLM."
—Safarath Shafi, CEO, EatEasy
“Os LLMs no banco de dados do HeatWave, o armazenamento de vetores no banco de dados, o processamento de vetores na memória escalável e o HeatWave Chat são recursos muito diferenciados da Oracle que democratizam a IA generativa e a tornam muito simples, segura e barata de usar. O uso do HeatWave e do AutoML para nossas necessidades empresariais já transformou nossos negócios de várias maneiras, e a introdução dessa inovação da Oracle provavelmente estimulará o crescimento de uma nova classe de aplicações em que os clientes estão procurando maneiras de aproveitar a IA generativa em seu conteúdo corporativo”.
—Eric Aguilar, Fundador, Aiwifi
Os LLMs integrados e o HeatWave Chat ajudam a fornecer aplicativos pré-configurados para conversas contextuais em linguagem natural. Não há necessidade de LLMs e GPUs externas.
O HeatWave GenAI pode ajudar você a conversar facilmente com seus dados, realizar pesquisas de similaridade em documentos e recuperar informações de seus dados proprietários.
Capacite desenvolvedores e equipes de negócios com recursos integrados e automação para aproveitar a IA generativa. Habilite facilmente conversas em linguagem natural e RAG.
Você pode usar os LLMs no banco de dados para ajudar a gerar ou resumir o conteúdo com base em documentos não estruturados. Os usuários podem fazer perguntas em linguagem natural por meio de aplicações, e o LLM processará a solicitação e entregará o conteúdo.
Combine o poder da IA generativa com outros recursos integrados do HeatWave, como o machine learning, para ajudar a reduzir custos e obter resultados mais precisos com mais rapidez. Neste exemplo, uma empresa de manufatura faz isso para manutenção preditiva. Os engenheiros podem usar o Oracle HeatWave AutoML para ajudar a gerar automaticamente um relatório de logs de produção anômalos e o HeatWave GenAI ajuda a determinar rapidamente a causa raiz do problema simplesmente fazendo uma pergunta em linguagem natural, em vez de analisar manualmente os logs.
Os chatbots podem usar o RAG para, por exemplo, ajudar a responder às perguntas dos funcionários sobre as políticas internas da empresa. Os documentos internos que detalham as políticas são armazenados como incorporações no HeatWave Vector Store. Para uma determinada consulta do usuário, o armazenamento de vetores ajuda a identificar os documentos mais semelhantes executando uma pesquisa de similaridade com as incorporações armazenadas. Esses documentos são usados para aumentar o prompt dado ao LLM para que ele forneça uma resposta precisa.
Os desenvolvedores podem criar aplicações aproveitando o poder combinado do machine learning integrado, da IA generativa e do armazenamento de vetores para fornecer recomendações personalizadas. Neste exemplo, a aplicação usa o sistema de recomendação HeatWave AutoML para recomendar restaurantes com base nas preferências do usuário ou no que ele pediu anteriormente. Com o HeatWave Vector Store, a aplicação também pode pesquisar os cardápios dos restaurantes em formato PDF para sugerir pratos específicos, proporcionando maior valor aos clientes.
A pesquisa de similaridade se concentra em encontrar conteúdo relacionado com base na semântica. A pesquisa de similaridade vai além das simples pesquisas de palavras-chave, considerando o significado subjacente em vez de pesquisar apenas as tags aplicadas. Neste exemplo, um advogado quer identificar rapidamente uma cláusula potencialmente problemática em contratos.
O HeatWave permitiu que as organizações executassem processamento de transações, análises em data warehouses e data lakes e machine learning em um único serviço de nuvem totalmente gerenciado. Hoje estamos anunciando a disponibilidade geral do HeatWave GenAI, com grandes modelos de linguagem (LLMs) no banco de dados, um armazenamento automatizado de vetores no banco de dados, processamento de vetores escalonável e a capacidade de ter conversas contextuais em linguagem natural.
Leia a publicação completa“Com LLMs no banco de dados prontos para uso e um armazenamento de vetores totalmente automatizado pronto para o processamento de vetores desde o primeiro dia, o HeatWave GenAI leva a simplicidade da IA (e a economia) a um nível que seus concorrentes não chegam nem perto.”
“A inovação de engenharia do HeatWave continua oferecendo a visão de um banco de dados em nuvem universal. A mais recente é a IA generativa feita no "estilo HeatWave", que inclui a integração de um armazenamento vetorial automatizado no banco de dados e LLMs no banco de dados diretamente no núcleo do HeatWave. Isso permite que os desenvolvedores gerem novas classes de aplicações ao combinar elementos do HeatWave.”
“O HeatWave GenAI forneceu um desempenho de processamento vetorial 30 vezes mais rápido que o Snowflake, 18 vezes mais rápido que o Google BigQuery e 15 vezes mais rápido que o Databricks, com um custo até 6 vezes menor. Para qualquer organização que leve a sério as cargas de trabalho de IA generativa de alto desempenho, investir os recursos da empresa em qualquer uma dessas três ou em outras ofertas de banco de dados vetorial é o equivalente a jogar dinheiro fora e tentar justificar afirmando que é uma boa ideia.”
“O HeatWave está dando um grande passo para tornar a IA generativa e a geração aumentada de recuperação (RAG) mais acessíveis, deixando toda a complexidade da criação de incorporações de vetores nos bastidores. Os desenvolvedores simplesmente apontam para os arquivos de origem que estão no armazenamento de objetos na nuvem, e o HeatWave faz o trabalho pesado.”
Leia nossas postagens de blog mais recentes para obter dicas, explicações técnicas e as melhores práticas.
Siga as instruções passo a passo e use o código que fornecemos para criar aplicações com tecnologia HeatWave GenAI de forma rápida e fácil.
Inscreva-se para obter uma avaliação gratuita do HeatWave GenAI. Você receberá US$ 300 em crédito na nuvem para experimentar os recursos por 30 dias.
Deseja aprender mais sobre o HeatWave GenAI? Deixe um de nossos especialistas ajudar.