Consulte dados no armazenamento de objetos em vários formatos de arquivo, incluindo CSV, Parquet, Avro e exporte arquivos de outros bancos de dados usando sintaxe SQL padrão e, opcionalmente, combine-os com dados transacionais em bancos de dados MySQL. O processamento de consultas é feito inteiramente no mecanismo HeatWave, para que você possa usar o HeatWave para cargas de trabalho não MySQL e cargas de trabalho compatíveis com o MySQL. Quando carregados no cluster HeatWave, os dados de qualquer fonte são automaticamente transformados em um único formato interno otimizado. Como resultado, consultar os dados no armazenamento de objetos é tão rápido quanto consultar os bancos de dados – uma inovação no setor.
Os resultados da consulta podem ser gravados no armazenamento de objetos, permitindo que os usuários os compartilhem facilmente e armazenem os resultados no armazenamento de objetos de forma econômica. Isso também permite que os desenvolvedores usem HeatWave para aplicações MapReduce.
Você pode usar o HeatWave para consultar dados semiestruturados no formato JSON no armazenamento de objetos, por exemplo, para desenvolver aplicativos de gerenciamento de conteúdo ou painéis em tempo real usando dados JSON no armazenamento de objetos. Com suporte nativo ao JavaScript no Lakehouse HeatWave, você pode usar o JavaScript para processar e consultar dados no armazenamento de objetos. Por exemplo, você pode criar aplicações de carregamento de conteúdo dinâmico usando os recursos avançados do JavaScript.
Com o HeatWave Vector Store, você pode fazer upload e consultar documentos não estruturados.
O desempenho incomparável do HeatWave é resultado de sua arquitetura escalável, que permite o paralelismo massivo para provisionar o cluster, carregar dados e processar consultas com até 512 nós. Cada nó do HeatWave em um cluster e cada núcleo em um nó podem processar dados particionados em paralelo, incluindo varreduras paralelas, junções, agrupamento, agregação e processamento top-k. Os algoritmos são projetados para sobrepor o tempo de computação com a comunicação de dados entre nós, o que ajuda a alcançar alta escalabilidade.
O HeatWave Autopilot fornece automação com reconhecimento de carga de trabalho para HeatWave com tecnologia de machine learning (ML). Os recursos do HeatWave Autopilot, como provisionamento automático, melhoria do plano de consulta automática (que aprende várias estatísticas de runtime de consultas anteriores para melhorar o plano para consultas futuras) e carregamento paralelo automático, foram aprimorados para o HeatWave Lakehouse. Recursos adicionais do HeatWave Lakehouse incluem:
Com o HeatWave AutoML, você pode usar dados no armazenamento de objetos, no banco de dados ou em ambos para criar, treinar, implementar e explicar modelos de ML. Você não precisa mover os dados para um serviço de nuvem de ML separado ou ser um especialista em ML. O HeatWave AutoML automatiza o pipeline de machine learning, incluindo seleção de algoritmo, amostragem inteligente de dados para treinamento de modelo, seleção de recursos e otimização de hiperparâmetros, economizando tempo e esforço significativos dos analistas de dados. O HeatWave AutoML suporta detecção de anomalias, previsão, classificação, regressão e tarefas de sistema de recomendação, mesmo em colunas de texto. Você pode usar o HeatWave AutoML sem custo adicional.
Tarefas como gerenciamento de alta disponibilidade, aplicação de patches, atualizações e backups são automatizadas com um serviço totalmente gerenciado. Os dados carregados no cluster HeatWave são recuperados automaticamente em caso de falha inesperada do nó de computação, sem retransformação de formatos de dados externos.
Com mecanismos de controle de acesso, como a autenticação de entidade de recurso da Oracle Cloud Infrastructure (OCI) ou solicitações pré-autenticadas, você pode ter controle total sobre o acesso às fontes do data lake.