Features von HeatWave

HeatWave

HeatWave ist eine speicherinterne, massiv parallele, hybride, spaltenförmige Datenverarbeitungs-Engine. Es implementiert hochmoderne Algorithmen für die verteilte Abfrageverarbeitung, die eine sehr hohe Performance bieten.

Entwickelt für großen Umfang und hohe Leistung

HeatWave partitioniert Daten massiv über ein Cluster von Knoten, die parallel betrieben werden können. Dies bietet eine hervorragende internodale Skalierbarkeit. Jeder Knoten innerhalb eines Clusters und jeder Kern innerhalb eines Knotens kann partitionierte Daten parallel verarbeiten. HeatWave verfügt über einen intelligenten Abfrage-Scheduler, der die Berechnung mit Netzwerkkommunikationsaufgaben überlappt, um eine sehr hohe Skalierbarkeit über Tausende von Kernen zu erreichen.

Optimiert für die Cloud und Daten im Objektspeicher

Die Abfrageverarbeitung in HeatWave wurde für Commodity-Server in der Cloud optimiert. Die Größe der Partitionen wurde optimiert, um sie an den Cache der zugrunde liegenden Formen anzupassen. Die Überlappung von Berechnungen mit der Kommunikation ist für die verfügbare Netzwerkbandbreite optimiert. Verschiedene Primitives zur Analyseverarbeitung verwenden die Hardwareanweisungen der zugrunde liegenden virtuellen Maschinen (VMs). HeatWave ist auch als skalierbare Datenverarbeitungs-Engine konzipiert, die für die Abfrage von Daten im Objektspeicher optimiert ist.


HeatWave GenAI

HeatWave GenAI bietet integrierte und automatisierte generative KI mit datenbankinternen großen Sprachmodellen (LLMs), einem automatisierten Vektorspeicher in der Datenbank und der Möglichkeit, kontextbezogene Konversationen in natürlicher Sprache zu führen. So können Sie die Vorteile generativer KI ohne KI-Expertise oder Datenbewegung nutzen.

Datenbankinterne LLMs

Verwenden Sie die integrierten, optimierten LLMs in allen Oracle Cloud Infrastructure-(OCI-)Regionen, OCI Dedicated Region und Cloud-übergreifend und erzielen Sie konsistente Ergebnisse mit vorhersehbarer Leistung über alle Bereitstellungen hinweg. Reduzieren Sie die Infrastrukturkosten, indem Sie die Bereitstellung von GPUs überflüssig machen.

In OCI Generative AI integriert

Greifen Sie über den OCI Generative AI Service auf vortrainierte, grundlegende Modelle von Cohere und Meta zu.

Datenbankinterner Vektorspeicher

Führen Sie RAG (Retrieval-Augmented Generation) über LLMs und Ihre eigenen Dokumente in verschiedenen Formaten durch, die im HeatWave Vector Store untergebracht sind, um genauere und kontextuell relevante Antworten zu erhalten – ohne die Daten in eine separate Vektordatenbank zu verschieben.

Automatisierte Generierung von Einbettungen

Nutzen Sie die automatisierte Pipeline, um proprietäre Dokumente im HeatWave Vector Store zu entdecken und aufzunehmen. So können Entwickler und Analysten ohne KI-Kenntnisse den Vektorspeicher einfacher verwenden.

Scale-out-Vektorverarbeitung

Die Vektorverarbeitung wird auf bis zu 512 HeatWave-Clusterknoten parallelisiert und mit der Speicherbandbreite ausgeführt. Dies trägt dazu bei, schnelle Ergebnisse mit einer geringeren Wahrscheinlichkeit eines Genauigkeitsverlusts zu liefern.

HeatWave Chat

Führen Sie kontextbezogene Konversationen auf der Grundlage Ihrer unstrukturierten Dokumente im Objektspeicher unter Verwendung natürlicher Sprache. Darüber hinaus können Sie den integrierten Lakehouse Navigator nutzen, um LLMs bei der Suche nach bestimmten Datensätzen zu unterstützen. So können Sie die Kosten senken und erhalten schneller genauere Ergebnisse.

Weitere Informationen zu HeatWave GenAI


HeatWave MySQL

HeatWave MySQL ist ein vollständig verwalteter Datenbankservice und der einzige auf MySQL Enterprise Edition basierende Cloud-Service mit erweiterten Sicherheitsfunktionen für Verschlüsselung, Datenmaskierung, Authentifizierung und einer Datenbank-Firewall. HeatWave verbessert die MySQL-Abfrageleistung um ein Vielfaches und ermöglicht Ihnen Echtzeitanalysen Ihrer Transaktionsdaten in MySQL – ohne die Komplexität, Latenz, Risiken und Kosten einer ETL-Duplizierung (Extrahieren, Transformieren und Laden) in eine separate Analysedatenbank.

Echtzeitanalysen ohne ETL

Analyseabfragen greifen auf die aktuellsten Daten zu, da Aktualisierungen von Transaktionen automatisch in Echtzeit in das HeatWave-Analysecluster repliziert werden. Es ist nicht erforderlich, die Daten zu indizieren, bevor Analyseabfragen ausgeführt werden. Sie können den komplexen, zeitaufwendigen und kostspieligen ETL-Prozess und die Integration mit einer separaten Analysedatenbank eliminieren.

Weitere Informationen zu HeatWave MySQL


HeatWave Lakehouse

Mit HeatWave Lakehouse können Benutzer ein halbes Petabyte an Daten im Objektspeicher abfragen – in verschiedenen Dateiformaten wie CSV, Parquet, Avro, JSON und Exportdateien aus anderen Datenbanken. Die Abfrageverarbeitung erfolgt vollständig in der HeatWave-Engine, sodass Kunden HeatWave zusätzlich zu MySQL-kompatiblen Workloads auch für Nicht-MySQL-Workloads nutzen können.

Schnelle Lakehouse-Analyse und maschinelles Lernen für alle Daten

Kunden können mithilfe von SQL-Standardbefehlen Daten in verschiedenen Formaten im Objektspeicher, Transaktionsdaten in MySQL Databases oder eine Kombination aus beidem abfragen. Genau so schnelle Abfrage von Daten im Objektspeicher wie in den Datenbanken, wie durch eine 10 TB TPC-H-Benchmark demonstriert wurde.

Mit HeatWave AutoML können Kunden Daten im Objektspeicher, in der Datenbank oder in beiden verwenden, um ML-Modelle automatisch zu erstellen, zu trainieren, bereitzustellen und zu erklären – ohne die Daten in einen separaten ML-Cloud-Service zu verschieben.

Scale-Out-Architektur für das Datenmanagement und die Verarbeitung von Abfragen

Die massiv partitionierte Architektur von HeatWave ermöglicht eine Scale-Out-Architektur für HeatWave Lakehouse. Die Verarbeitung von Abfragen und die Abläufe beim Datenmanagement wie das Laden/Neuladen von Daten werden entsprechend des Datenumfangs skaliert. Kunden können mit HeatWave Lakehouse bis zu einem halben Petabyte an Daten im Objektspeicher abfragen, ohne diese in die MySQL Database zu kopieren. Der HeatWave-Cluster lässt sich auf 512 Knoten skalieren.

Performancesteigerung und Zeitersparnis durch eine auf maschinelles Lernen gestützte Automatisierung

HeatWave Autopilot-Funktionen wie das automatische Provisioning, die automatische Verbesserung des Abfrageplans und das automatische parallele Laden wurden für HeatWave Lakehouse erweitert, wodurch sich der Aufwand für die Datenbankadministration reduziert und somit die Performance gesteigert wird. Die neuen HeatWave Autopilot-Funktionen sind auch für HeatWave Lakehouse verfügbar.

  • Die automatische Schema-Inferenz leitet automatisch die Zuordnung von Dateidaten zur entsprechenden Schemadefinition für alle unterstützten Dateitypen, einschließlich CSV, ab. Dadurch müssen Kunden die Schemazuordnung von Dateien nicht manuell definieren und aktualisieren, wodurch sie Zeit und Aufwand sparen.
  • Das adaptive Daten-Sampling erfasst auf intelligente Weise die Dateien im Objektspeicher, um Informationen abzuleiten, die HeatWave Autopilot verwendet, um Vorhersagen für die Automatisierung zu treffen. Mithilfe der adaptiven Datenerfassung kann HeatWave Autopilot in weniger als einer Minute scannen und somit Vorhersagen treffen, wie z. B. eine Schemazuordnung für eine 400-TB-Datei.
  • Mit dem adaptiven Datenfluss passt sich HeatWave Lakehouse dynamisch an die Performance des zugrunde liegenden Objektspeichers in jeder Region an, um die Gesamtleistung, das Preis-Leistungs-Verhältnis und die Verfügbarkeit zu verbessern.

Weitere Informationen HeatWave Lakehouse


HeatWave AutoML

HeatWave AutoML enthält alles, was Benutzer zum Erstellen, Trainieren und Erklären von ML-Modellen in HeatWave benötigen, und das ohne zusätzliche Kosten.

Kein separater Service für das maschinelle Lernen erforderlich

Mit datenbankinternen ML-Funktionen in HeatWave müssen Kunden keine Daten zu einem separaten ML-Service verschieben. Mit HeatWave Lakehouse können sie maschinelles Lernen, Training, Inferenz und Erklärung einfach und sicher auf Daten anwenden, die sowohl in MySQL als auch im Objektspeicher gespeichert sind. Dadurch können sie ML-Initiativen beschleunigen, die Sicherheit erhöhen und Kosten senken.

Weniger Zeit und Aufwand mit der Automatisierung des ML-Lebenszyklus

HeatWave AutoML automatisiert den Lebenszyklus des maschinellen Lernens, einschließlich Algorithmusauswahl, intelligentes Data Sampling für das Modelltraining, Funktionsauswahl und Hyperparameter-Optimierung, was Datenanalysten und Data Scientists viel Zeit und Mühe spart. Aspekte der Pipeline für maschinelles Lernen können angepasst werden, einschließlich Algorithmusauswahl, Featureauswahl und Hyperparameteroptimierung. HeatWave AutoML unterstützt Aufgaben der Anomalieerkennung, Prognose, Klassifizierung, Regression und Recommendation Engine, einschließlich in Textspalten.

Recommendation Engine für personalisierte Empfehlungen

Durch die Berücksichtigung sowohl impliziten Feedbacks (vergangene Käufe, Surfverhalten usw.) als auch expliziten Feedbacks (Bewertungen, Likes usw.) kann die HeatWave AutoML-Recommendation Engine personalisierte Empfehlungen generieren. Analysten können beispielsweise Artikel vorhersagen, die einem Benutzer gefallen werden, Benutzer, denen ein bestimmter Artikel gefallen wird, und Bewertungen, die Artikel erhalten werden. Außerdem können sie bei einem bestimmten Benutzer eine Liste ähnlicher Benutzer und bei einem bestimmten Element eine Liste ähnlicher Elemente erhalten.

Interaktive HeatWave AutoML-Konsole

Mit der interaktiven Konsole können Business Analysts ML-Modelle mit der visuellen Benutzeroberfläche erstellen, trainieren, ausführen und erklären – ohne SQL-Befehle oder Programmierung. Die Konsole macht es außerdem einfach, Was-wäre-wenn-Szenarien zu untersuchen, um geschäftliche Annahmen zu bewerten, wie z. B. „Wie würde sich eine um 30 % höhere Investition in bezahlte Werbung in sozialen Medien auf Umsatz und Gewinn auswirken?“

Erklärbare ML-Modelle

Alle von HeatWave AutoML trainierten Modelle sind erklärbar. HeatWave AutoML liefert Prognosen mit einer Erläuterung der Ergebnisse und hilft Organisationen bei der Compliance, Fairness, Wiederholbarkeit, Kausalität und Vertrauen.

Nutzung von aktuellen Fähigkeiten

Entwickler und Datenanalysten können ML-Modelle mit vertrauten SQL-Befehlen erstellen. Sie müssen keine neuen Tools und Programmiersprachen lernen. Darüber hinaus ist HeatWave AutoML in beliebte Notebooks wie Jupyter und Apache Zeppelin integriert.


HeatWave Autopilot

HeatWave Autopilot bietet eine Workload-bezogene, durch maschinelles Lernen unterstützte Automatisierung. Darüber hinaus verbessert der Service die Performance und Skalierbarkeit, sorgt für mehr Produktivität von Entwicklern und Datenbankadministratoren und trägt dazu bei, menschliche Fehler zu eliminieren – und das ohne erforderliches Fachwissen zur Datenbankoptimierung. HeatWave Autopilot automatisiert viele der wichtigsten und häufig anspruchsvollsten Aspekte der Erzielung einer hohen Abfrageperformance im großen Maßstab – einschließlich Provisioning, Laden von Daten, Abfrageausführung und Fehlerbehandlung. HeatWave Autopilot ist für HeatWave MySQL-Kunden ohne zusätzliche Kosten erhältlich.

HeatWave Autopilot bietet zahlreiche Funktionen sowohl für HeatWave als auch für OLTP, darunter

  • Das automatische Provisioning prognostiziert die Anzahl der HeatWave-Knoten, die für die Ausführung einer Workload erforderlich sind, indem adaptives Sampling von Tabellendaten durchgeführt wird, für die Analysen erforderlich sind. Das bedeutet, dass Entwickler und DBAs die optimale Größe ihres Clusters nicht mehr manuell schätzen müssen.
  • Mit dem automatischen Threadpooling kann der Datenbankservice mehr Transaktionen für eine bestimmte Hardwarekonfiguration verarbeiten, wodurch ein höherer Durchsatz für OLTP-Workloads bereitgestellt wird und verhindert wird, dass er bei hohen Transaktionen und gleichzeitigem Zugriff gelöscht wird.
  • Die automatische Ausprägungsvorhersage überwacht kontinuierlich die OLTP-Workload, einschließlich Durchsatz und Pufferpool-Trefferrate, um die richtige Compute-Ausprägung zu einem bestimmten Zeitpunkt zu empfehlen. So erhalten Kunden immer das beste Preis-Leistungs-Verhältnis.
  • Die automatische Codierung bestimmt die optimale Darstellung der Spalten, die unter Berücksichtigung der Abfragen in HeatWave, geladen werden. Diese optimale Darstellung bietet die beste Abfrageperformance und minimiert die Größe des Clusters, um die Kosten zu minimieren.
  • Die automatische Verbesserung des Abfrageplans lernt verschiedene Statistiken aus der Ausführung von Abfragen und verbessert den Ausführungsplan zukünftiger Abfragen. Dadurch wird die Systemperformance verbessert, wenn weitere Abfragen ausgeführt werden.
  • Die adaptive Abfrageoptimierung verwendet verschiedene Statistiken, um Datenstrukturen und Systemressourcen anzupassen, nachdem die Abfrageausführung gestartet wurde. Unabhängig davon wird die Abfrageausführung für jeden Knoten basierend auf der tatsächlichen Datenverteilung zur Laufzeit optimiert. Dies trägt dazu bei, die Performance von Ad-hoc-Abfragen um bis zu 25 % zu verbessern.
  • Die automatische Datenplatzierung prognostiziert die Spalte, in der Tabellen im Speicher partitioniert werden sollen, um die beste Performance für Abfragen zu erzielen. Außerdem wird mit der neuen Spaltenempfehlung die erwartete Verbesserung der Abfrageperformance vorhergesagt. Dadurch wird die Datenverschiebung über Knoten hinweg minimiert, da Operatoren bei der manuellen Auswahl der Spalte suboptimale Auswahlmöglichkeiten treffen können.
  • Die automatische Komprimierung bestimmt den optimalen Komprimierungsalgorithmus für jede Spalte, wodurch die Lade- und Abfrageleistung durch schnellere Datenkomprimierung und -dekomprimierung verbessert wird. Durch die Reduzierung der Speichernutzung können Kunden ihre Kosten um bis zu 25 % senken.
  • Die Indexierung (begrenzte Verfügbarkeit) legt automatisch die Indizes fest, die Kunden erstellen oder aus ihren Tabellen löschen sollten, um den OLTP-Durchsatz zu optimieren. Dabei wird maschinelles Lernen verwendet, um eine Vorhersage basierend auf einzelnen Anwendungs-Workloads zu erstellen. Auf diese Weise werden den Kunden die zeitaufwändigen Aufgaben zum Erstellen optimaler Indizes für ihre OLTP-Workloads erspart. Es fällt auch kein Aufwand zur Pflege der Inidzies aufgrund sich verändernder Workloads mehr an.

Echtzeitelastizität

Mit Echtzeitelastizität können Kunden die Größe ihres HeatWave-Clusters um eine beliebige Anzahl von Knoten erhöhen bzw. verringern, ohne dass es zu Ausfallzeiten oder schreibgeschützten Zeiten kommt.

Konstant hohe Leistungsfähigkeit auch in Spitzenzeiten sowie geringere Kosten – ohne Ausfallzeiten

Der Vorgang der Größenänderung dauert nur wenige Minuten, während dieser Zeit bleibt HeatWave online und für alle Vorgänge verfügbar. Sobald die Größe geändert wurde, werden die Daten aus dem Objektspeicher heruntergeladen, automatisch zwischen allen verfügbaren Cluster-Knoten neu verteilt und stehen sofort für Abfragen zur Verfügung. Dadurch profitieren Kunden selbst in Spitzenzeiten von der konstant hohen Leistungsfähigkeit und den niedrigeren Kosten, indem sie ihren HeatWave-Cluster bei Bedarf verkleinern – ohne dass es zu Ausfallzeiten oder schreibgeschützten Zeiten kommt.

Durch effizientes Neuladen von Daten aus dem Objektspeicher können Kunden ihr HeatWave-Cluster auch unterbrechen und fortsetzen, um Kosten zu senken.

Keine überdimensionierten Instanzen

Kunden können ihren HeatWave-Cluster auf eine beliebige Anzahl von Knoten erweitern oder reduzieren. Sie sind nicht durch starre Größenmodelle auf überdimensionierte und kostspielige Instanzen beschränkt. Bei HeatWave zahlen Kunden nur für genau die Ressourcen, die sie nutzen.


Verfügbar in Public Clouds und Ihrem Data Center

Sie können HeatWave auf OCI, AWS oder Azure bereitstellen. Darüber hinaus können Sie Daten aus On-Premises-OLTP-Anwendungen auf HeatWave replizieren, um Analysen in nahezu Echtzeit zu erhalten und Vektordaten in der Cloud zu verarbeiten. Sie können HeatWave außerdem in Ihrem Data Center mit OCI Dedicated Region verwenden.

HeatWave auf AWS bietet AWS-Kunden eine native Erfahrung. Konsole, Control Plane und Data Plane befinden sich in AWS.