Funcții HeatWave

HeatWave

HeatWave este un motor de procesare a datelor în memorie, masiv paralel, hibrid columnar. Acesta implementează algoritmi de ultimă generație pentru procesarea distribuită a interogărilor care oferă performanțe foarte ridicate.

Arhitectură creată pentru scalare și performanță masive

HeatWave partiționează masiv datele într-un cluster de noduri, care pot fi exploatate în paralel. Acest lucru oferă o scalabilitate internă excelentă. Fiecare nod din cadrul unui cluster și fiecare nucleu din cadrul unui nod pot procesa în paralel date partiționate. HeatWave dispune de un sistem inteligent de programare a interogărilor, care suprapune sarcinile de calcul cu cele de comunicare în rețea pentru a obține o scalabilitate foarte mare pe mii de nuclee.

Optimizat pentru cloud și date în stocarea obiectelor

Procesarea interogărilor în HeatWave a fost optimizată pentru serverele de bază din cloud. Dimensiunile partițiilor au fost optimizate pentru a corespunde memoriei cache a formelor de bază. Suprapunerea calculului cu comunicarea este optimizată în funcție de lățimea de bandă disponibilă în rețea. Diverse tipuri de procesare analitică utilizează instrucțiunile hardware ale mașinilor virtuale (VM) subiacente. HeatWave este, de asemenea, conceput pentru a fi un motor de procesare a datelor la scară largă, optimizat pentru interogarea datelor în stocarea obiectelor.


HeatWave GenAI

HeatWave GenAI oferă AI generativă integrată și automatizată cu modele lingvistice mari (LLM) în bază de date; un depozit de vectori automatizat, în bază de date; și capacitatea de a purta conversații contextuale în limbaj natural – permițându-vă să profitați de AI generativă fără expertiză AI sau mișcare de date.

LLM-uri în baza de date

Utilizați LLM-urile încorporate și optimizate în toate regiunile Oracle Cloud Infrastructure (OCI), regiunea dedicată OCI și în toate cloud-urile și obțineți rezultate consecvente cu performanțe previzibile în toate implementările. Ajutați la reducerea costurilor de infrastructură prin eliminarea necesității de a furniza GPU-uri.

Integrat cu OCI Generative AI

Accesați modelele de bază preinstruite de la Cohere și Meta prin OCI Generative AI service.

Depozit vectorial în baza de date

Efectuați o generare augmentată de recuperare (RAG) în LLM-uri și în documentele dvs. de proprietate în diverse formate găzduite în HeatWave Vector Store pentru a obține răspunsuri mai precise și mai relevante din punct de vedere contextual, fără a muta datele într-o bază de date vectoriale separată.

Generarea automată a încorporărilor

Profitați de pipeline-ul automatizat pentru a descoperi și ingera documente de proprietate în HeatWave Vector Store, facilitând utilizarea depozitul vectorial de către dezvoltatori și analiști fără cunoștințe de AI.

Procesare vectorială la scară largă

Procesarea vectorială este paralelizată pe până la 512 noduri de cluster HeatWave și executată la lățimea de bandă a memoriei, contribuind la obținerea unor rezultate rapide cu o probabilitate redusă de pierdere a preciziei.

HeatWave Chat

Purtați conversații contextuale bazate pe documentele dvs. nestructurate din stocarea obiectelor, utilizând limbajul natural. Utilizați navigatorul integrat Lakehouse Navigator pentru a ghida LLM-urile în căutarea prin seturi de date specifice, ajutându-vă să reduceți costurile și să obțineți rezultate mai exacte mai rapid.

Aflaţi mai multe despre HeatWave GenAI


HeatWave MySQL

HeatWave MySQL este un serviciu de baze de date complet gestionat și singurul serviciu cloud construit pe MySQL Enterprise Edition, cu funcții avansate de securitate pentru criptare, mascarea datelor, autentificare și un firewall pentru baze de date. HeatWave îmbunătățește performanța interogărilor MySQL cu câteva ordine de mărime și vă permite să obțineți analize în timp real ale datelor dvs. tranzacționale în MySQL – fără complexitatea, latența, riscurile și costurile duplicării ETL (extract, transform și load) într-o bază de date analitice separată.

Analize în timp real, fără ETL

Interogările analitice au acces la cele mai actuale informații, deoarece actualizările din tranzacții sunt replicate automat în timp real către clusterul analitic HeatWave. Nu este necesar să indexați datele înainte de a rula interogări de analize. Puteți elimina procesul ETL complex, consumator de timp și costisitor și integrarea cu o bază de date analitică separată.

Aflaţi mai multe despre HeatWave MySQL


HeatWave Lakehouse

HeatWave Lakehouse permite utilizatorilor să interogheze o jumătate de petabyte de date în stocarea de obiecte – într-o varietate de formate de fișiere, cum ar fi CSV, Parquet, Avro, JSON și să exporte fișiere din alte baze de date. Procesarea interogărilor se face în întregime în motorul HeatWave, ceea ce permite clienților să beneficieze de HeatWave pentru sarcini de lucru altele decât MySQL, pe lângă sarcinile de lucru compatibile cu MySQL.

Analiză rapidă de tip lakehouse și machine learning pentru toate datele

Clienții pot interoga date în diferite formate în stocarea obiectelor, date tranzacționale în baze de date MySQL sau o combinație a ambelor, folosind comenzi SQL standard. Interogarea datelor din spațiul de stocare pentru obiecte este la fel de rapidă ca interogarea bazelor de date, așa cum o demonstrează o evaluare de 10 TB TPC-H.

Cu HeatWave AutoML, clienții pot utiliza datele din stocarea obiectelor, din baza de date sau din ambele pentru a construi, instrui, implementa și explica automat modele ML – fără a transfera datele către un serviciu cloud ML separat.

Arhitectură scalabilă pentru managementul datelor și procesarea interogărilor

Arhitectura masiv partiționată a HeatWave permite o arhitectură scale-out pentru HeatWave Lakehouse. Operațiunile de procesare a interogărilor și de management al datelor, cum ar fi încărcarea/reîncărcarea datelor, cresc odată cu dimensiunea datelor. Cu HeatWave Lakehouse, clienții pot interoga până la o jumătate de petabyte de date în stocarea obiectelor, fără a le copia în baza de date MySQL. Clusterul HeatWave se poate extinde până la 512 noduri.

Creșteți performanța și economisiți timp cu ajutorul automatizării bazate pe machine learning

Capacitățile HeatWave Autopilot, cum ar fi provizionarea automată, îmbunătățirea automată a planului de interogare și încărcarea automată paralelă, au fost îmbunătățite pentru HeatWave Lakehouse, reducând și mai mult cheltuielile de administrare a bazei de date și îmbunătățind performanța. Noile capacități HeatWave Autopilot sunt disponibile și pentru HeatWave Lakehouse.

  • Inferența automată a schemei calculează automat corespondența dintre datele din fișiere și definiția schemei corespunzătoare pentru toate tipurile de fișiere acceptate, inclusiv cele de tip CSV. Prin urmare, clienții nu mai trebuie să definească și să actualizeze manual cartografierea schemei fișierelor, ceea ce le permite să economisească timp și efort.
  • Eșantionarea adaptivă a datelor eșantionează în mod inteligent fișierele din stocarea obiectelor pentru a obține informații utilizate de HeatWave Autopilot pentru a face predicții pentru automatizare. Folosind eșantionarea adaptivă a datelor, HeatWave Autopilot poate scana și face predicții, cum ar fi maparea schemelor pe un fișier de 400 TB, în mai puțin de un minut.
  • Fluxul de date adaptiv permite HeatWave Lakehouse să se adapteze în mod dinamic la performanța stocului de obiecte de bază din orice regiune pentru a îmbunătăți performanța generală, raportul preț-performanță și disponibilitatea.

Aflați mai multe despre HeatWave Lakehouse


HeatWave AutoML

HeatWave AutoML include tot ce au nevoie utilizatorii pentru a construi, antrena și explica modele de învățare automată în HeatWave, fără costuri suplimentare.

Nu este nevoie de un serviciu separat de machine learning

Cu învățarea automată în baza de date din HeatWave, clienții nu mai trebuie să transfere datele către un serviciu separat de învățare automată. Cu HeatWave Lakehouse, aceștia pot aplica cu ușurință și în siguranță instruirea, inferența și explicarea proceselor de tip machine learning la datele stocate atât în MySQL, cât și în memoria de obiecte. Ca urmare, acestea pot accelera inițiativele de ML, își pot consolida securitatea și își pot reduce costurile.

Economisiți timp și efort cu automatizarea ciclului de viață prin machine learning

HeatWave AutoML automatizează ciclul de viață al procesului de machine learning, inclusiv selecția algoritmului, eșantionarea inteligentă a datelor pentru antrenarea modelului, selecția caracteristicilor și optimizarea hiperparametrilor – ceea ce le permite analiștilor și cercetătorilor de date să economisească timp și efort semnificative. Unele aspecte ale canalului machine learning pot fi personalizate, inclusiv selecția algoritmului, a caracteristicilor și optimizarea hiperparametrilor. HeatWave AutoML susține detectarea anomaliilor, previziunile, clasificarea, regresia și sarcinile sistemului de recomandare, inclusiv pe coloane de text.

Sistem de recomandări personalizate

Prin luarea în considerare atât a feedback-ului implicit (achiziții anterioare, comportament de navigare și așa mai departe), cât și a feedback-ului explicit (evaluări, aprecieri și altele), sistemul de recomandare HeatWave AutoML poate genera recomandări personalizate. Analiștii, de exemplu, pot prezice articolele care vor fi pe placul unui utilizator, utilizatorii cărora le va plăcea un anumit articol și evaluările pe care le vor primi articolele respective. De asemenea, având în vedere un utilizator, pot obține o listă de utilizatori similari, iar având în vedere un anumit element, pot obține o listă de elemente similare.

Consolă interactivă HeatWave AutoML

Consola interactivă le permite analiștilor de afaceri să construiască, să antreneze, să ruleze și să explice modele ML folosind o interfață vizuală – fără a utiliza comenzi SQL sau codare. De asemenea, consola facilitează explorarea scenariilor de tip „ce-ar fi dacă” pentru a evalua ipotezele de afaceri – de exemplu, „Cum ar afecta veniturile și profitul o investiție cu 30% mai mare în publicitatea plătită din rețelele sociale?”.

Modele ML explicabile

Toate modelele instruite cu ajutorul HeatWave AutoML pot fi explicate. HeatWave AutoML oferă predicții cu explicarea rezultatelor, ceea ce ajută organizațiile în ceea ce privește respectarea reglementărilor, corectitudinea, repetabilitatea, cauzalitatea și încrederea.

Utilizați competențele curente

Dezvoltatorii și analiștii de date pot construi modele de tip machine learning folosind comenzi SQL familiare; nu trebuie să învețe instrumente și limbaje noi. În plus, HeatWave AutoML este integrat cu notebookuri cunoscute, cum ar fi Jupyter și Apache Zeppelin.


HeatWave Autopilot

HeatWave Autopilot asigură o automatizare bazată pe învățare automată, în funcție de volumul de lucru. Îmbunătățește performanța și scalabilitatea fără a necesita expertiză în reglarea bazelor de date, sporește productivitatea dezvoltatorilor și a administratorilor de baze de date și ajută la eliminarea erorilor umane. HeatWave Autopilot automatizează multe dintre cele mai importante și adesea dificile aspecte ale obținerii unei performanțe ridicate a interogărilor la scară largă – inclusiv asigurarea accesului, încărcarea datelor, executarea interogărilor și soluționarea defecțiunilor. HeatWave Autopilot este disponibil fără costuri suplimentare pentru clienții HeatWave MySQL.

HeatWave Autopilot oferă numeroase capabilități atât pentru HeatWave, cât și pentru OLTP, inclusiv

  • Alocarea automată prezice numărul de noduri HeatWave necesare pentru rularea unei sarcini de lucru prin eșantionarea adaptivă a datelor din tabele care necesită analiză. Asta înseamnă că dezvoltatorii și DBA nu mai trebuie să estimeze manual dimensiunea optimă a clusterului lor.
  • Gruparea automată a thread-urilor permite serviciului de baze de date să proceseze mai multe tranzacții pentru o anumită configurație hardware, oferind un randament mai mare pentru sarcinile de lucru OLTP și prevenind reducerea nivelurilor ridicate ale acestuia de tranzacții și de concurență.
  • Previziunea configurației automate monitorizează în permanență volumul de lucru OLTP, inclusiv debitul și rata de accesare a rezervei de stocare, pentru a recomanda forma de calcul potrivită în orice moment – ceea ce permite clienților să obțină întotdeauna cel mai bun raport preț-performanță.
  • Codarea automată determină reprezentarea optimă a coloanelor care sunt încărcate în HeatWave, luând în considerare interogările. Această reprezentare optimă oferă cea mai bună performanță de interogare și reduce la minimum dimensiunea clusterului pentru a micșora costurile.
  • Îmbunătățirea automată a planului de interogare deprinde diverse statistici din execuția interogărilor și îmbunătățește planul de execuție a interogărilor viitoare. Acest aspect îmbunătățește performanța sistemului pe măsură ce rulează mai multe interogări.
  • Optimizarea adaptivă a interogărilor utilizează diverse statistici pentru a regla structurile de date și resursele de sistem după începerea execuției interogării – optimizând în mod independent execuția interogării pentru fiecare nod pe baza distribuției reale a datelor în momentul execuției. Acest lucru contribuie la îmbunătățirea performanței interogărilor ad-hoc cu până la 25%.
  • Plasarea automată a datelor prezice coloana pe care ar trebui să fie partiționate tabelele în memorie pentru a obține cele mai bune performanțe pentru interogări. Prezice, de asemenea, avansul preconizat al performanței interogării cu noua recomandare de coloană. Acest fapt reduce la minimum deplasarea datelor între noduri din cauza alegerilor nesatisfăcătoare pe care le pot face operatorii atunci când selectează manual coloana.
  • Comprimarea automată determină algoritmul optim de comprimare pentru fiecare coloană, ceea ce îmbunătățește performanțele de încărcare și de interogare prin comprimarea și decomprimarea mai rapidă a datelor. Prin reducerea consumului de memorie, clienții își pot reduce costurile cu până la 25%.
  • Indexarea (disponibilitate limitată): determină automat indexurile pe care clienții ar trebui să le creeze sau să le elimine din tabelele lor pentru a optimiza randamentul OLTP, utilizând învățarea automată pentru a face o predicție bazată pe volumul de lucru individual al aplicației. Acest lucru ajută clienții să elimine sarcinile consumatoare de timp de creare a indexurilor optime pentru volumele lor de lucru OLTP și de menținere a acestora în timp, pe măsură ce volumele de lucru evoluează.

Elasticitate în timp real

Elasticitatea în timp real le permite clienților să mărească sau să reducă dimensiunea clusterului HeatWave cu orice număr de noduri necesar, fără a suferi nicio indisponibilitate sau perioadă doar de citire.

Performanță ridicată și constantă, chiar și în perioadele de vârf, și costuri reduse, fără timpi de indisponibilitate

Operațiunea de redimensionare durează doar câteva minute, timp în care HeatWave rămâne online, disponibil pentru toate operațiunile. Odată redimensionate, datele sunt descărcate din stocarea obiectelor, sunt reechilibrate automat între toate nodurile de cluster disponibile și devin imediat disponibile pentru interogări. Ca urmare, clienții beneficiază de performanțe ridicate și constante, chiar și în perioadele de vârf, și de costuri mai mici prin reducerea clusterului HeatWave atunci când este cazul – fără a suferi vreo indisponibilitate sau cu timpi doar de citire.

Cu reîncărcarea eficientă a datelor din stocarea obiectelor, clienții pot, de asemenea, să întrerupă și să reia clusterul HeatWave pentru a reduce costurile.

Nicio instanță supraalocată

Clienții își pot extinde sau reduce clusterul HeatWave la orice număr de noduri. Aceștia nu sunt constrânși de instanțe supraaprovizionate și costisitoare forțate de modele rigide de dimensionare. Cu HeatWave, clienții plătesc doar pentru resursele pe care le utilizează.


Disponibil în cloudurile publice și în centrul dvs. de date

Puteți implementa HeatWave pe OCI, AWS sau Azure. Puteți replica datele din aplicațiile OLTP la fața locului în HeatWave pentru a obține analize aproape în timp real și pentru a procesa date vectoriale în cloud. De asemenea, puteți utiliza HeatWave în centrul dvs. de date cu OCI Dedicated Region.

HeatWave pe AWS oferă o experienţă nativă pentru clienţii AWS. Consola, planul de control și planul de date se află în AWS.