O MySQL HeatWave da Oracle é reconhecido como o único serviço de banco de dados em nuvem capaz de fornecer transações, análises em tempo real em data warehouses e data lakes e machine learning em um único banco de dados MySQL. Tudo isso sem a complexidade, os riscos ou os custos da duplicação ETL. Agora, o MySQL HeatWave dá mais um salto à frente com um novo armazenamento de vetores, recursos de IA generativa, disponibilidade do MySQL HeatWave Lakehouse na Amazon Web Services (AWS) e muito mais.
O suporte para IA generativa, juntamente com a capacidade de aumentar o treinamento de grande modelo de linguagem (LLM) com os próprios dados de uma empresa, foi o anúncio mais importante para o MySQL HeatWave no Oracle CloudWorld. “As melhorias de hoje no MySQL HeatWave são outro passo significativo em nossa jornada para resolver problemas prementes de dados do cliente, análise e IA”, disse Edward Screven, arquiteto corporativo chefe da Oracle. “Agora, a loja de vetores e a IA generativa trazem o poder dos LLMs para os clientes, fornecendo a eles uma maneira intuitiva de interagir com os dados em sua empresa e obter as respostas precisas de que precisam para seus negócios.”
““Agora, a loja de vetores e a IA generativa trazem o poder dos LLMs para os clientes, fornecendo a eles uma maneira intuitiva de interagir com os dados em sua empresa e obter as respostas precisas de que precisam para seus negócios.”
O armazenamento de vetores ingere dados empresariais de um data lakehouse e os armazena como incorporações geradas por meio de um codificador para uso como contexto adicional para consultas de LLM. O usuário solicita que os LLMs passem por uma pesquisa de similaridade na loja de vetores. O resultado é usado como uma consulta de entrada que combina o prompt original e a pesquisa de similaridade, permitindo que o LLM forneça uma resposta mais contextual e relevante derivada de dados empresariais.
“A saída da loja de vetores é apenas uma entrada para o LLM”, disse Nipun Agarwal, vice-presidente sênior de desenvolvimento do MySQL HeatWave da Oracle. “Os LLMs não são treinados nesses dados proprietários, então você não corre o risco de qualquer vazamento de informações.”
Atualmente em visualização privada, a combinação de armazenamento de vetores e IA generativa representa uma ferramenta poderosa para ajudar as organizações a aproveitar dados proprietários para consultas e pesquisas, levando a respostas mais precisas para consultas em linguagem natural.
Lançado em julho de 2023 na Oracle Cloud Infrastructure (OCI), o MySQL HeatWave Lakehouse acelera a análise de dados de armazenamentos de objetos em vários formatos sem importá-los para MySQL, tornando o HeatWave acessível até mesmo para cargas de trabalho que não sejam MySQL. Os clientes da AWS agora podem aproveitar esses mesmos recursos porque o MySQL HeatWave Lakehouse é executado nativamente na plataforma.
“Usamos a infraestrutura da AWS para executar o MySQL HeatWave na AWS, incluindo o HeatWave Lakehouse”, disse Screven. “Isso significa que, se você usar o HeatWave Lakehouse na AWS, não haverá taxa de saída de dados. Você pode analisar arquivos armazenados em buckets do S3.”
Centenas de terabytes de dados em CSV, Apache Parquet, Avro e outros formatos, incluindo exportações de outros bancos de dados, podem ser consultados nativamente. O MySQL HeatWave também está disponível para usuários do Microsoft Azure como parte do Oracle Database Service for Microsoft Azure.
“O MySQL HeatWave agora pode consultar diretamente dados armazenados em arquivos no armazenamento de objetos. Isso significa que você não precisa ingeri-los em MySQL”, disse Screven. “Isso também significa que o MySQL HeatWave Lakehouse se torna um serviço que você pode usar para todos os seus dados: dispositivos de IoT, arquivos de log, exportações de outros bancos de dados.”
O MySQL Autopilot Indexing é outro recurso novo que Screven anunciou no CloudWorld. Atualmente com disponibilidade limitada, o Autopilot Indexing acelera e melhora a indexação utilizando machine learning para fazer recomendações para criar e eliminar índices. O Autopilot Indexing também gera avaliações de impacto no desempenho, além de recomendações para ajudar a informar as decisões de ajuste. Outros recursos anunciados recentemente para o MySQL HeatWave incluem: