MySQL HeatWave von Oracle ist der einzige Cloud-Datenbankservice, der Transaktionen, Echtzeitanalysen über Data Warehouses und Data Lakes hinweg sowie maschinelles Lernen in einer MySQL-Datenbank bereitstellen kann. All das ohne die Komplexität, Risiken oder Kosten der ETL-Duplizierung. Jetzt macht MySQL HeatWave –in einem Forbes-Artikel als potenzielle „Killer-App“ für Oracle bezeichnet – einen weiteren Sprung nach vorn mit einem neuen Vektorspeicher, generativen KI-Fähigkeiten, der Verfügbarkeit von MySQL HeatWave Lakehouse auf Amazon Web Services (AWS) und vielem mehr.
Die Unterstützung für generative KI und die Möglichkeit, das Training von Large Language Models (LLM) mit unternehmenseigenen Daten zu erweitern, war die wichtigste Ankündigung für MySQL HeatWave auf der Oracle CloudWorld. „Die heutigen Verbesserungen an MySQL HeatWave sind ein weiterer wichtiger Schritt auf unserem Weg, um dringende Kundendaten-, Analyse- und KI-Probleme anzugehen“, so Edward Screven, Chief Corporate Architect von Oracle. „Jetzt bringen Vektorspeicher und generative KI die Leistung von LLMs zu den Kunden und bieten ihnen eine intuitive Möglichkeit, mit Daten in ihrem Unternehmen zu interagieren und die genauen Antworten zu erhalten, die sie für ihr Geschäft benötigen.“
„Jetzt bringen Vektorspeicher und generative KI die Leistung von LLMs zu den Kunden und bieten ihnen eine intuitive Möglichkeit, mit Daten in ihrem Unternehmen zu interagieren und die genauen Antworten zu erhalten, die sie für ihr Geschäft benötigen.“
Der Vektorspeicher nimmt Unternehmensdaten aus einem Data Lakehouse auf und speichert sie dann als Einbettungen, die über einen Encoder erzeugt werden, um sie als zusätzlichen Kontext für LLM-Abfragen zu verwenden. Benutzeraufforderungen zu LLMs werden einer Ähnlichkeitssuche mit dem Vektorspeicher unterzogen. Das Ergebnis wird als Eingabeabfrage verwendet, die die ursprüngliche Eingabeaufforderung und die Ähnlichkeitssuche kombiniert, so dass das LLM eine kontextbezogenere, relevante Antwort aus Unternehmensdaten liefern kann.
„Die Vektorspeicherausgabe ist nur ein Input für das LLM“, so Nipun Agarwal, Senior Vice President Oracle für die MySQL HeatWave-Entwicklung. „LLMs sind nicht auf diese geschützten Daten geschult, weshalb Sie nicht Gefahr laufen, dass Informationen nach außen dringen.“
Die derzeit in einer privaten Vorschau gezeigte Kombination aus Vektorspeicher und generativer KI stellt ein leistungsstarkes Tool dar, mit dem Unternehmen ihre eigenen Daten für Abfragen und Suchvorgänge nutzen können, was letztlich zu genaueren Antworten auf natürlichsprachliche Abfragen führt.
MySQL HeatWave Lakehouse wurde im Juli 2023 auf Oracle Cloud Infrastructure (OCI) gestartet und beschleunigt Analysen der Daten von Objektspeichern in verschiedenen Formaten, ohne sie in MySQL zu importieren. Dadurch wird HeatWave auch für Nicht-MySQL-Workloads zugänglich. Jetzt können AWS-Kunden dieselben Funktionen nutzen, da MySQL HeatWave Lakehouse nativ auf der Plattform ausgeführt wird.
„Wir verwenden AWS-Infrastruktur, um MySQL HeatWave in AWS auszuführen, einschließlich HeatWave Lakehouse“, so Screven. „Wenn Sie HeatWave Lakehouse in AWS nutzen, fallen keine Gebühren für den Daten-Egress an. Sie können Dateien analysieren, die in S3-Buckets gespeichert sind.“
Hunderte von Terabytes an Daten in CSV-, Apache Parquet-, Avro- und anderen Formaten, einschließlich Exporten aus anderen Datenbanken, können nativ abgefragt werden. MySQL HeatWave ist auch für Microsoft Azure-Benutzer als Teil von Oracle Database Service for Microsoft Azure verfügbar.
„MySQL HeatWave kann jetzt direkt Daten abfragen, die in Dateien im Objektspeicher gespeichert sind. Das bedeutet, dass Sie sie nicht in MySQL einlesen müssen“, so Screven. „Außerdem bedeutet das, dass MySQL HeatWave Lakehouse zu einem Service wird, den Sie für alle Ihre Daten verwenden können: IoT-Geräte, Logdateien, Exporte aus anderen Datenbanken.“
MySQL Autopilot Indexing ist eine weitere neue Funktion, die Screven auf der CloudWorld angekündigt hat. Die derzeit nur begrenzt verfügbare Autopilot-Indexierung beschleunigt und verbessert die Indexierung, indem sie mithilfe von maschinellem Lernen Empfehlungen zum Erstellen und Löschen von Indizes gibt. Die Autopilot-Indexierung generiert außerdem Bewertungen der Leistungsauswirkungen sowie Empfehlungen, die bei Tuning-Entscheidungen helfen. Weitere kürzlich angekündigte Funktionen für MySQL HeatWave umfassen: