O Oracle HeatWave GenAI fornece IA generativa integrada, automatizada e segura com modelos de linguagem grandes (LLMs) no banco de dados; um armazenamento de vetores automatizado no banco de dados; processamento de vetores em escala ampliada; e a capacidade de ter conversas contextuais em linguagem natural, permitindo que você aproveite os benefícios da IA generativa sem conhecimento especializado, movimentação de dados ou custo adicional.
Os principais recursos do HeatWave GenAI incluem
As versões quantizadas dos seguintes LLMs no banco de dados estão atualmente disponíveis no HeatWave:
Você pode criar um armazenamento vetorial para conteúdo não estruturado da empresa com um único comando SQL. Todas as etapas para criar um armazenamento de vetores e incorporações de vetores são automatizadas e executadas dentro do banco de dados, incluindo descobrir os documentos no armazenamento de objetos, analisá-los, gerar incorporações de maneira altamente paralela e otimizada e inseri-los no armazenamento de vetores, tornando o Armazenamento de Vetores HeatWave eficiente e fácil de usar.
HeatWave é executado em hardware comum. Os LLMs no banco de dados não são executados em GPUs, mas em CPUs. Como resultado, você pode reduzir custos e não precisa se preocupar com a disponibilidade de LLMs em vários data centers.
Ao usar LLMs e um armazenamento vetorial no banco de dados, os dados não são movidos, aumentando a segurança.
Sim, o HeatWave GenAI está disponível nativamente na AWS, juntamente com outros recursos, incluindo o HeatWave MySQL, o HeatWave Lakehouse, o HeatWave AutoML e o HeatWave Autopilot.
Sim, é possível gerar incorporações para dados de texto em 27 idiomas.
Os prompts podem ser emitidos em inglês. Os prompts emitidos em outros idiomas, como espanhol e alemão, podem ser traduzidos para o inglês.
Não, a pesquisa vetorial é executada no cluster HeatWave.
O HeatWave é executado em um nó MySQL. Recomendamos um nó MySQL com formato MySQL.32, além de nós HeatWave usando o formato HeatWave.512GB para um ambiente de produção. Para desenvolvimento/testes, pode ser usada um formato menor do MySQL. Você pode revisar os formatos MySQL compatíveis aqui. Para HeatWave GenAI, o formato HeatWave.32GB não é compatível.
Os formatos compatíveis são PDF, text, PowerPoint, Word e HTML.
Não há custo adicional além do custo do cluster HeatWave para usar o HeatWave GenAI. Você pode invocar LLMs no banco de dados e modelos de incorporação fornecidos com o HeatWave GenAI sem custo adicional. Você também pode invocar LLMs externos disponíveis por meio da OCI Generative AI na OCI e no Amazon Bedrock na AWS e, em seguida, esses serviços serão cobrados.
Não, os LLMs são modelos pré-treinados. Os seus dados não são usados para treinar LLMs.
Não, os LLMs no banco de dados fornecidos com HeatWave não podem ser ajustados.
Não, você não pode trazer seus próprios LLMs ou modelos de incorporação. No entanto, você pode invocar os LLMs externos ou modelos de incorporação disponíveis por meio da OCI Generative AI ao executar o HeatWave GenAI na OCI e por meio do Amazon Bedrock ao executar o HeatWave GenAI na AWS.
Com base em nossos testes, os resultados são comparáveis aos LLMs não quantificados para casos de uso que dependem do HeatWave Vector Store. Você pode facilmente testar os modelos para avaliar o desempenho e a qualidade dos resultados.
Você precisa gerar incorporações apenas uma vez e elas serão armazenadas no HeatWave Vector Store. As alterações em documentos não estruturados no armazenamento de objetos acionam automaticamente as atualizações das incorporações de vetores associados.
Sim, o suporte ao reconhecimento óptico de caracteres permite que o HeatWave Vector Store converta o conteúdo digitalizado salvo como imagens em dados de texto que podem ser analisados, por exemplo, para realizar pesquisas de similaridade.