Funzionalità di HeatWave

HeatWave

HeatWave è un motore in-memory di elaborazione dei dati a colonne e massicciamente parallelo. Implementa algoritmi all'avanguardia per l'elaborazione di query distribuite che offrono prestazioni estremamente elevate.

Progettato per garantire prestazioni e scalabilità massime

HeatWave suddivide in modo massiccio i dati in un cluster di nodi, che possono essere utilizzati in parallelo. Ciò garantisce un'eccellente scalabilità internodale. Tutti i nodi all'interno di un cluster e tutte le memorie centrali all'interno di un nodo possono elaborare i dati suddivisi in parallelo. HeatWave dispone di un programmatore di query intelligente che si sovrappone l'elaborazione con i task di comunicazione di rete per ottenere una scalabilità molto elevata tra migliaia di memorie centrali.

Ottimizzato per il cloud e i dati nello storage degli oggetti

L'elaborazione delle query in HeatWave è stata ottimizzata per i server di base nel cloud. Le dimensioni delle partizioni sono state ottimizzate perché siano adatte alla cache delle forme sottostanti. La sovrapposizione di elaborazione e comunicazione è ottimizzata per la larghezza di banda di rete disponibile. Diversi primitive di elaborazione degli analytics utilizzano le istruzioni hardware delle virtual machine (VM) di base. HeatWave è anche progettato per essere un motore di elaborazione dei dati scalabile, ottimizzato per eseguire query sui dati nello storage degli oggetti.


HeatWave GenAI

HeatWave GenAI offre un'intelligenza artificiale generativa integrata e automatizzata con modelli linguistici di grandi dimensioni (LLM, large language model) nel database, una memoria di vettore automatizzata nel database, e la possibilità di avere conversazioni contestuali in linguaggio naturale, consentendoti di sfruttare l'intelligenza artificiale generativa senza avere bisogno di competenze nell'area o di spostare dati.

LLM nel database

Utilizza i LLM integrati e ottimizzati in tutte le region di Oracle Cloud Infrastructure (OCI), OCI Dedicated Region e nei cloud e ottieni risultati coerenti con performance prevedibili in tutte le implementazioni. Riduci i costi dell'infrastruttura eliminando il bisogno di eseguire il provisioning delle GPU.

Integrazione con OCI Generative AI

Accedi a modelli di base pre-addestrati da Cohere e Meta tramite il servizio OCI Generative AI.

Memoria di vettore in-database

Esegui la retrieval-augmented gneration (RAG) tra LLM e i tuoi documenti proprietari in vari formati ospitati in HeatWave Vector Store per ottenere risposte più accurate e contestualmente pertinenti, senza spostare i dati in un database vettoriale separato.

Generazione automatica degli incorporamenti

Sfrutta la pipeline automatizzata per scoprire e acquisire documenti proprietari in HeatWave Vector Store, semplificando l'utilizzo della memoria di vettore per sviluppatori e analisti senza competenze di intelligenza artificiale.

Elaborazione vettoriale a scalabilità orizzontale

L'elaborazione vettoriale viene parallelizzata su un massimo di 512 nodi cluster HeatWave ed eseguita a larghezza di banda della memoria, contribuendo a fornire risultati rapidi con una ridotta probabilità di perdita di accuratezza.

HeatWave Chat

Fai in modo che le conversazioni contestuali utilizzino informazioni dei tuoi documenti non strutturati nello storage degli oggetti utilizzando il linguaggio naturale. Utilizza il Lakehouse Navigator integrato per guidare i LLM nella ricerca di set di dati specifici, riducendo i costi e ottenendo risultati più accurati in tempi più rapidi.

Scopri di più su HeatWave GenAI


HeatWave MySQL

HeatWave MySQL è un servizio di database completamente gestito e l'unico servizio cloud basato su MySQL Enterprise Edition, con funzioni di sicurezza avanzate per la cifratura, il mascheramento dei dati, l'autenticazione e un firewall di database. HeatWave migliora enormemente le performance delle query MySQL e ti consente di ottenere analytics in tempo reale sui dati transazionali in MySQL, senza la complessità, la latenza, i rischi e i costi della duplicazione extract, transform and load (ETL) in un database di analytics separato.

Analytics in tempo reale senza ETL

Le query di analytics hanno accesso alle informazioni più recenti poiché gli aggiornamenti dalle transazioni vengono replicati automaticamente in tempo reale sul cluster di analytics HeatWave. Non è necessario indicizzare i dati prima di eseguire le query di analytics. Puoi eliminare la necessità di un complesso, laborioso e costoso processo ETL e di un'integrazione con un database di analytics separato.

Scopri di più su HeatWave MySQL


HeatWave Lakehouse

MySQL Lakehouse consente agli utenti di eseguire query sulla metà di un petabyte di dati nello storage degli oggetti in vari formati di file, ad esempio CSV, Parquet, Avro, JSON e file di esportazione da altri database. L'elaborazione delle query viene eseguita interamente nel motore HeatWave, cosa che permette ai clienti di sfruttare HeatWave per carichi di lavoro non MySQL oltre ai carichi di lavoro compatibili con MySQL.

Analytics lakehouse e machine mearning veloci su tutti i dati

I clienti possono eseguire query sui dati transazionali nei database MySQL, nei dati di vari formati nello storage degli oggetti o in una combinazione di entrambi utilizzando i comandi MySQL standard. L'esecuzione di query sui dati nello storage degli oggetti risulta veloce quanto l'esecuzione di query sui database, come dimostrato da un benchmark TPC-H 10 TB.

Con HeatWave AutoML, i clienti possono utilizzare i dati nello storage degli oggetti, nel database o in entrambi i modi per creare, addestrare, implementare e spiegare automaticamente i modelli ML, senza spostare i dati in un servizio cloud ML separato.

Architettura a scalabilità orizzontale per la gestione dei dati e l'elaborazione delle query

L'architettura massicciamente suddivisa di HeatWave consente un'architettura a scalabilità orizzontale per HeatWave Lakehouse. L'elaborazione delle query e le operazioni di gestione dei dati, come il caricamento/ricaricamento dei dati, si ridimensionano a seconda della dimensione dei dati. I clienti possono eseguire query fino a metà di un petabyte di dati nello storage degli oggetti con HeatWave Lakehouse senza copiarlo nel database MySQL. Il cluster HeatWave viene ridimensionato fino a 512 nodi.

Aumenta le prestazioni e risparmia tempo grazie all'automazione basata sul machine learning

Le funzionalità di HeatWave Autopilot, come il provisioning automatico, il miglioramento del piano di query automatico e il caricamento parallelo automatico sono state migliorate per HeatWave Lakehouse, riducendo ulteriormente il sovraccarico amministrativo del database e migliorando le prestazioni. Le nuove funzionalità di HeatWave Autopilot sono disponibili anche per HeatWave Lakehouse.

  • L'inferenza automatica di schema determina automaticamente la mappatura dei dati di file alla definizione di schema corrispondente per tutti i tipi di file supportati, CSV compreso. Di conseguenza, i clienti non devono definire e aggiornare manualmente il mapping di schema dei file, risparmiando tempo e fatica.
  • Il campionamento adattivo dei dati campiona in modo intelligente i file nello storage degli oggetti per ricavare le informazioni utilizzate da HeatWave Autopilot per fare previsioni sull'automazione. Grazie al campionamento adattivo dei dati, HeatWave Autopilot è in grado di analizzare e fare previsioni, come il mapping degli schemi su un file da 400 TB in meno di un minuto.
  • Il flusso di dati adattivo consente a HeatWave Lakehouse di adattarsi in modo dinamico alle prestazioni dello storage degli oggetti di base in qualsiasi area per migliorare le prestazioni, il rapporto prezzo/prestazioni e la disponibilità complessive.

Scopri di più su HeatWave Lakehouse


HeatWave AutoML

HeatWave AutoML include tutto ciò di cui gli utenti hanno bisogno per creare, addestrare e spiegare i modelli di machine learning all'interno di HeatWave, senza costi aggiuntivi.

Non c'è bisogno di un servizio separato di machine learning

Grazie al machine learning in-database presente all'interno di HeatWave, i clienti non devono spostare i dati in un servizio di ML separato. Possono applicare in modo semplice e sicuro formazione, inferenza e spiegazione del machine learning ai dati memorizzati sia all'interno di MySQL che nello storage degli oggetti con HeatWave Lakehouse. Di conseguenza, possono accelerare le iniziative di ML, aumentare la sicurezza e ridurre i costi.

Risparmia tempo e fatica con l'automazione del ciclo di vita del machine learning

HeatWave AutoML automatizza il ciclo di vita del machine learning, inclusa la selezione degli algoritmi, il campionamento intelligente dei dati per la formazione dei modelli, la selezione delle funzioni e l'ottimizzazione degli iperparametri, cosa che permette ad analisti dei dati e data scientist di risparmiare molto tempo e tanta fatica. È possibile personalizzare alcuni aspetti della pipeline di machine learning, tra cui la selezione degli algoritmi, la scelta delle funzioni e l'ottimizzazione degli iperparametri. HeatWave AutoML supporta il rilevamento delle anomalie, le previsioni, la classificazione, la regressione e i task del sistema di raccomandazione, comprese le colonne di testo.

Sistema di raccomandazione per consigli personalizzati

Considerando sia il feedback implicito (acquisti passati, comportamento di navigazione e così via) che il feedback esplicito (rating, like e così via), il sistema di raccomandazione HeatWave AutoML può generare consigli personalizzati. Gli analisti, ad esempio, possono prevedere gli elementi che piaceranno a un utente, quali utenti apprezzeranno un elemento specifico e i rating che gli elementi riceveranno. Possono anche, a seconda dell'utente, ottenere una lista di utenti simili e, a seconda dell'elemento specifico, ottenere un elenco di elementi simili.

Console interattiva HeatWave AutoML

La console interattiva consente ai business analyst di creare, addestrare, eseguire e spiegare i modelli ML tramite un'interfaccia visiva, e senza ricorrere a comandi SQL o programmazione. La console semplifica inoltre l'esplorazione di scenari What-If per valutare le ipotesi di business, ad esempio "In che modo investire il 30% in più nella pubblicità dei social media a pagamento incide su ricavi e profitti?"

Modelli di ML spiegabili

Tutti i modelli formati da HeatWave AutoML sono spiegabili. HeatWave AutoML fornisce previsioni con una spiegazione dei risultati, aiutando le organizzazioni a rispettare la compliance normativa e a garantire equità, ripetibilità, causalità e fiducia.

Sfrutta competenze attuali

Gli sviluppatori e gli analisti di dati possono creare modelli di machine learning utilizzando comandi SQL già noti, senza dovere quindi imparare a usare nuovi strumenti e linguaggi. Inoltre, HeatWave AutoML è integrato con notebook molto diffusi quali Jupyter e Apache Zeppelin.


HeatWave Autopilot

HeatWave Autopilot fornisce un'automazione basata sul machine learning e workload-aware. Migliora prestazioni e scalabilità senza avere bisogno di competenze per l'ottimizzazione del database, aumenta la produttività di sviluppatori e DBA e aiuta a eliminare gli errori umani. HeatWave Autopilot automatizza molti degli aspetti più importanti e spesso impegnativi del raggiungere prestazioni elevate a livello di query su larga scala, tra cui provisioning, caricamento dei dati, esecuzione delle query e gestione degli errori. HeatWave Autopilot è disponibile senza costi aggiuntivi per i clienti di HeatWave MySQL.

HeatWave Autopilot fornisce numerose funzionalità sia per HeatWave che per OLTP, tra cui

  • Il provisioning automatico prevede il numero di nodi HeatWave necessari per l'esecuzione di un carico di lavoro tramite il campionamento adattivo dei dati di tabella sui quali sono richiesti analytics. Ciò significa che gli sviluppatori e i DBA non devono più fare una valutazione manuale della dimensione ottimale del loro cluster.
  • Il pooling automatico dei thread consente al servizio di database di elaborare un numero maggiore di transazioni per una determinata configurazione hardware, offrendo un throughput più elevato per i carichi di lavoro OLTP e assicurando che il throughput resti a livelli elevati di transazioni e concorrenza.
  • La previsione automatica della forma monitora costantemente il carico di lavoro OLTP, comprese la velocità di throughput e la frequenza di accesso al buffer pool, per consigliare la forma di computazione corretta in qualsiasi momento e permette ai clienti di ottenere sempre il miglior rapporto prezzo/prestazioni.
  • La codifica automatica determina la rappresentazione ottimale delle colonne caricate su HeatWave, prendendo in considerazione le query. Questa rappresentazione ottimale fornisce le migliori prestazioni delle query e minimizza le dimensioni del cluster per ridurre al minimo i costi.
  • Il miglioramento automatico del piano di query apprende varie statistiche dall'esecuzione delle query e migliora il piano di esecuzione delle query future. In questo modo è possibile migliorare le prestazioni del sistema man mano che vengono eseguite altre query.
  • L'ottimizzazione adattiva delle query utilizza varie statistiche per regolare le strutture dei dati e le risorse di sistema dopo l'avvio dell'esecuzione delle query, ottimizzando in modo indipendente l'esecuzione delle query per ogni nodo in base alla distribuzione effettiva dei dati in fase di runtime. Ciò consente di migliorare le prestazioni delle query ad hoc fino al 25%.
  • Il posizionamento automatico dei dati prevede la colonna in cui le tabelle devono essere suddivise in memoria per raggiungere le prestazioni migliori per le query. Prevede inoltre il guadagno previsto nelle prestazioni delle query con il suggerimento della nuova colonna. Ciò riduce al minimo lo spostamento dei dati tra i nodi dovuto a scelte non ottimali che gli operatori possono effettuare quando selezionano manualmente la colonna.
  • La compressione automatica determina l'algoritmo di compressione ottimale per ogni colonna, cosa che migliora le prestazioni di caricamento e query con compressione e decompressione dei dati più veloci. Grazie alla riduzione nell'utilizzo della memoria, i clienti possono diminuire i costi fino al 25%.
  • L'indicizzazione (disponibilità limitata) determina automaticamente gli indici che i clienti devono creare o eliminare dalle proprie tabelle per ottimizzare il throughput OLTP, utilizzando il machine learning per effettuare una previsione in base ai carichi di lavoro delle singole applicazioni. Ciò aiuta i clienti a eliminare le lunghe attività di creazione di indici ottimali per i carichi di lavoro OLTP e a mantenerli nel tempo man mano che i carichi di lavoro si evolvono.

Elasticità in tempo reale

L'elasticità in tempo reale permette ai clienti di aumentare o ridurre le dimensioni del loro cluster HeatWave di qualsiasi numero di nodi, senza incappare in periodi di inattività o di sola lettura.

Prestazioni elevate costanti, anche nei momenti di picco, e costi ridotti senza tempi di inattività

Per eseguire il ridimensionamento servono solo alcuni minuti, durante i quali HeatWave rimane online, disponibile per tutte le operazioni. Una volta ridimensionati, i dati vengono scaricati dallo storage degli oggetti e ripartiti automaticamente tra tutti i nodi cluster disponibili, per diventare poi immediatamente disponibili per le query. Di conseguenza, i clienti traggono vantaggio da prestazioni sempre elevate, anche nei momenti di punta, e riducono i costi ridimensionando il cluster HeatWave quando risulta necessario, senza rischiare periodi di inattività o di sola lettura.

Grazie all'efficienza del ricaricamento dei dati dallo storage degli oggetti, i clienti possono anche sospendere e riprendere il loro cluster HeatWave per ridurre i costi.

Nessuna istanza su cui è stato eseguito overprovisioning

I clienti possono espandere o ridurre il proprio cluster HeatWave di qualsiasi numero di nodi. Non sono vincolati a istanze con provisioning eccessivo e costose, forzate da modelli di dimensione rigidi. Con HeatWave i clienti pagano unicamente per le risorse che utilizzano.


Disponibile nei cloud pubblici e nel tuo data center

Puoi implementare HeatWave su OCI, AWS o Azure. Puoi replicare i dati dalle applicazioni OLTP on-premise a HeatWave per ottenere analytics quasi in tempo reale ed elaborare i dati vettoriali nel cloud. Puoi anche utilizzare HeatWave nel tuo data center con OCI Dedicated Region.

HeatWave su AWS offre un'esperienza nativa per i clienti AWS. La console, il piano di controllo e il piano dati risiedono in AWS.