O HeatWave é um mecanismo de processamento de dados colunar, híbrido e massivamente paralelo na memória. Ele implementa algoritmos de última geração para processar as consultas distribuídas que ofereçam alto desempenho.
O HeatWave particiona massivamente os dados em um cluster de nós, que podem ser operados em paralelo. Isso fornece excelente escalabilidade entre eles. Cada nó dentro de um cluster e cada núcleo dentro de um nó podem processar dados particionados em paralelo. O HeatWave possui um agendador de consultas inteligente que sobrepõe o processamento com tarefas de comunicação de rede para obter uma escalabilidade muito alta entre milhares de núcleos.
O processamento de consultas no HeatWave foi otimizado para servidores comuns na nuvem. Os tamanhos das partições foram otimizados para caber no cache das formas subjacentes. A sobreposição do processamento com comunicação é otimizada para a largura de banda de rede disponível. Diversas unidades menores de processamento utilizam instruções de hardware oriundas de Máquinas Virtuais (VMs) subjacentes. O HeatWave também foi projetado para ser um mecanismo de processamento de dados escalonável, otimizado para consultar dados no armazenamento de objetos.
O HeatWave GenAI fornece IA generativa integrada e automatizada com grandes modelos de linguagem (LLMs) no banco de dados, armazenamento automatizado de vetores no banco de dados e a capacidade de ter conversas contextuais em linguagem natural, permitindo que você aproveite a IA generativa sem experiência em IA ou movimentação de dados.
Use os LLMs integrados e otimizados em todas as regiões da Oracle Cloud Infrastructure (OCI), OCI Dedicated Region e entre nuvens e obtenha resultados consistentes com desempenho previsível em todas as implementações. Ajude a reduzir os custos de infraestrutura eliminando a necessidade de provisionar GPUs.
Acesse modelos básicos pré-treinados da Cohere e da Meta por meio do serviço OCI Generative AI.
Execute a geração aumentada de recuperação (RAG) em LLMs e em seus documentos proprietários em vários formatos armazenados no HeatWave Vector Store para obter respostas mais precisas e contextualmente relevantes, sem mover os dados para um banco de dados vetorial separado.
Aproveite o pipeline automatizado para ajudar a descobrir e ingerir documentos proprietários no HeatWave Vector Store, facilitando o uso do armazenamento de vetores por desenvolvedores e analistas sem experiência em IA.
O processamento vetorial é paralelizado em até 512 nós do cluster HeatWave e executado na largura de banda da memória, ajudando a fornecer resultados rápidos com menos chances de perda de precisão.
Tenha conversas contextuais baseadas em seus documentos não estruturados no armazenamento de objetos usando linguagem natural. Use o Lakehouse Navigator integrado para ajudar a orientar os LLMs na pesquisa de conjuntos de dados específicos, ajudando a reduzir custos e a obter resultados mais precisos com mais rapidez.
O HeatWave MySQL é um serviço de banco de dados totalmente gerenciado e o único serviço de nuvem baseado no MySQL Enterprise Edition, com recursos avançados de segurança para criptografia, mascaramento de dados, autenticação e um firewall de banco de dados. O HeatWave melhora o desempenho das consultas MySQL em ordens de magnitude e permite que você obtenha análises em tempo real dos seus dados transacionais no MySQL, sem a complexidade, a latência, os riscos e o custo da duplicação de extração, transformação e carregamento (ETL) em um banco de dados de análise separado.
As consultas analíticas acessam as informações mais atuais, pois as atualizações das transações são replicadas automaticamente em tempo real para o cluster de análises do HeatWave. Não há necessidade de indexar os dados antes de executar consultas de análise. Elimine o processo de ETL complexo, demorado e caro e evite a integração com um banco de dados à parte para análise.
O HeatWave Lakehouse permite aos usuários consultar meio petabyte de dados no armazenamento de objetos em uma variedade de formatos de arquivo, como CSV, Parquet, Avro, JSON, e exportar arquivos de outros bancos de dados. O processamento de consultas é feito inteiramente no mecanismo do HeatWave, permitindo que os clientes aproveitem o HeatWave para cargas de trabalho não MySQL, além de cargas de trabalho compatíveis com MySQL.
Os clientes podem consultar dados em vários formatos no armazenamento de objetos, dados transacionais em bancos de dados MySQL ou uma combinação de ambos usando comandos SQL padrão. Consultar os dados no armazenamento de objetos é tão rápido quanto consultar os bancos de dados, conforme demonstrado por um benchmark de TPC-H de 10 TB.
Com o HeatWave AutoML, os clientes podem usar dados no armazenamento de objetos, no banco de dados ou em ambos para construir, treinar, implementar e explicar modelos de ML automaticamente, sem mover os dados para um serviço de nuvem de ML separado.
A arquitetura massivamente particionada do HeatWave permite uma arquitetura escalável para o HeatWave Lakehouse. O processamento de consultas e as operações de gerenciamento de dados, como carregamento/recarregamento, são dimensionados de acordo com o tamanho dos dados. Os clientes podem consultar até meio petabyte de dados no armazenamento de objetos com o HeatWave Lakehouse sem copiá-los para o banco de dados MySQL. O cluster do HeatWave é dimensionado para 512 nós.
Os recursos do HeatWave Autopilot, como provisionamento automático, aprimoramento automático do plano de consulta e carregamento paralelo automático, foram aprimorados para HeatWave Lakehouse, reduzindo ainda mais a sobrecarga de administração de banco de dados e melhorando o desempenho. Os novos recursos do HeatWave Autopilot também estão disponíveis para o HeatWave Lakehouse.
O HeatWave AutoML inclui tudo o que os usuários precisam para criar, treinar e explicar modelos de machine learning no HeatWave, sem custo adicional.
Com machine learning no banco de dados do HeatWave, os clientes não precisam mover os dados para um serviço de machine learning separado. Eles podem aplicar treinamento, inferência e explicação de machine learning de maneira fácil e segura aos dados armazenados no MySQL e no armazenamento de objetos com HeatWave Lakehouse. Como resultado, eles podem acelerar as iniciativas de ML, aumentar a segurança e reduzir custos.
O HeatWave AutoML automatiza o ciclo de vida do machine learning, incluindo seleção de algoritmos, amostragem inteligente de dados para treinamento de modelos, seleção de recursos e otimização de hiperparâmetros, economizando tempo e esforço significativos para analistas de dados e cientistas de dados. Aspectos do pipeline de machine learning podem ser personalizados, incluindo seleção de algoritmos, seleção de recursos e otimização de hiperparâmetros. O HeatWave AutoML suporta detecção de anomalias, previsão, classificação, regressão e tarefas de sistema de recomendação, inclusive em colunas de texto.
Ao considerar o feedback implícito (compras anteriores, comportamento de navegação e assim por diante) e o feedback explícito (classificações, curtidas e assim por diante), o sistema de recomendação do HeatWave AutoML pode gerar recomendações personalizadas. Os analistas, por exemplo, podem prever itens que um usuário irá gostar, usuários que irão gostar de um item específico e classificações que os itens receberão. Eles também podem, dado um usuário, obter uma lista de usuários semelhantes, e dado um item específico, obter uma lista de itens semelhantes.
O console interativo permite que os analistas de negócios criem, treinem, executem e expliquem modelos de ML usando uma interface visual, sem usar comandos SQL ou qualquer codificação. O console também facilita a exploração de cenários hipotéticos para avaliar as suposições de negócios, por exemplo: "Como investir 30% a mais em publicidade paga em mídias sociais afetaria a receita e o lucro?"
Todos os modelos treinados pelo HeatWave AutoML são explicáveis. O HeatWave AutoML fornece previsões com uma explicação dos resultados, ajudando as organizações a manter a conformidade regulatória, imparcialidade, repetibilidade, causalidade e confiança.
Desenvolvedores e analistas de dados podem construir modelos de machine learning usando comandos SQL familiares; eles não precisam aprender novas ferramentas e linguagens. Além disso, o HeatWave AutoML é integrado a notebooks populares como Jupyter e Apache Zeppelin.
O HeatWave Autopilot fornece automação baseada em machine learning e com reconhecimento de carga de trabalho. Ele melhora o desempenho e a escalabilidade sem exigir experiência em ajuste de banco de dados, aumenta a produtividade de desenvolvedores e DBAs e ajuda a eliminar erros humanos. O HeatWave Autopilot automatiza muitos dos aspectos mais importantes e muitas vezes desafiadores de alcançar um alto desempenho de consultas em escala, incluindo provisionamento, carregamento de dados, execução de consultas e tratamento de falhas. O HeatWave Autopilot está disponível sem custo adicional para os clientes do HeatWave MySQL.
O HeatWave Autopilot fornece vários recursos para HeatWave e OLTP, incluindo
A elasticidade em tempo real permite que os clientes aumentem ou diminuam o tamanho do cluster HeatWave por qualquer número de nós sem incorrer em tempo de inatividade ou somente leitura.
A operação de redimensionamento leva apenas alguns minutos, durante os quais o HeatWave permanece online, disponível para todas as operações. Depois de redimensionados, os dados são baixados do armazenamento de objetos, rebalanceados automaticamente entre todos os nós de cluster disponíveis e ficam imediatamente disponíveis para consultas. Como resultado, os clientes se beneficiam de um desempenho consistentemente alto, mesmo em horários de pico, e custos mais baixos ao reduzir o tamanho do cluster HeatWave quando apropriado, sem incorrer em tempo de inatividade ou somente leitura.
Com o recarregamento eficiente de dados do armazenamento de objetos, os clientes também podem pausar e retomar seu cluster HeatWave para reduzir custos.
Os clientes podem expandir ou reduzir o cluster HeatWave para qualquer número de nós. Eles não estão limitados a instâncias superprovisionadas e caras, impostas por modelos de dimensionamento rígidos. Com o HeatWave, os clientes pagam apenas pelos recursos que forem usados.
Você pode implementar o HeatWave na OCI, AWS ou Azure. Você pode replicar dados de aplicações OLTP on-premises para HeatWave para obter análises quase em tempo real e processar dados vetoriais na nuvem. Você também pode usar o HeatWave em seu data center com a OCI Dedicated Region.
O HeatWave na AWS oferece uma experiência nativa para os clientes da AWS. O console, o plano de controle e o plano de dados residem na AWS.