Oracle HeatWave GenAI bietet integrierte, automatisierte und sichere generative KI mit datenbankinternen großen Sprachmodellen (LLMs), einem automatisierten Vektorspeicher in der Datenbank, Scale-out-Vektorverarbeitung und der Möglichkeit, kontextbezogene Konversationen in natürlicher Sprache zu führen. So können Sie die Vorteile generativer KI ohne KI-Expertise, Datenbewegung oder zusätzliche Kosten nutzen.
Die wichtigsten Features von HeatWave GenAI sind:
Quantisierte Versionen der folgenden in der Datenbank enthaltenen LLMs sind derzeit in HeatWave verfügbar:
Sie können mit einem einzigen SQL-Befehl einen Vektorspeicher für unstrukturierte Unternehmensinhalte erstellen. Alle Schritte zur Erstellung eines Vektorspeichers und von Vektoreinbettungen werden automatisiert und innerhalb der Datenbank ausgeführt, einschließlich der Erkennung der Dokumente im Objektspeicher, ihrer Analyse, der Generierung von Einbettungen auf hochgradig parallele und optimierte Weise und ihrer Einfügung in den Vektorspeicher, wodurch HeatWave Vector Store effizient und benutzerfreundlich wird.
HeatWave läuft auf handelsüblicher Hardware. Datenbankinterne LLMs laufen nicht auf GPUs, sondern auf CPUs. Dadurch können Sie Kosten senken und müssen sich keine Sorgen über die Verfügbarkeit von LLMs in verschiedenen Rechenzentren machen.
Bei der Verwendung von datenbankinternen LLMs und einem datenbankinternen Vektorspeicher verlassen die Daten die Datenbank nicht, was zur Erhöhung der Datensicherheit beiträgt.
Ja, HeatWave GenAI ist nativ auf AWS verfügbar, zusammen mit anderen HeatWave-Funktionen, darunter HeatWave MySQL, HeatWave Lakehouse, HeatWave AutoML und HeatWave Autopilot.
Ja, Einbettungen können für Textdaten in 27 Sprachen generiert werden.
Prompts können auf Englisch ausgegeben werden. Prompts, die in anderen Sprachen wie Spanisch und Deutsch ausgegeben werden, können ins Englische übersetzt werden.
Nein, die Vektorsuche wird innerhalb des HeatWave-Clusters durchgeführt.
HeatWave wird auf einem MySQL-Knoten ausgeführt. Wir empfehlen einen MySQL-Knoten mit einer MySQL.32-Ausprägung sowie HeatWave-Knoten mit der Ausprägung HeatWave.512 GB für eine Produktionsumgebung. Für die Entwicklung/Tests kann eine kleinere MySQL-Ausprägung verwendet werden. Sie können die unterstützten MySQL-Ausprägungen hier einsehen. Für HeatWave GenAI wird die Ausprägung HeatWave.32 GB nicht unterstützt.
PDF, Text, PowerPoint, Word und HTML werden unterstützt.
Für die Nutzung von HeatWave GenAI fallen keine zusätzlichen Kosten an, die über die Kosten des HeatWave-Clusters hinausgehen. Sie können ohne zusätzliche Kosten datenbankinterne LLMs und Einbettungsmodelle aufrufen, die mit HeatWave GenAI bereitgestellt werden. Sie können außerdem externe LLMs aufrufen, die über OCI Generative AI auf OCI und Amazon Bedrock auf AWS verfügbar sind. Die Services werden Ihnen anschließend in Rechnung gestellt.
Nein, LLMs sind vortrainierte Modelle. Ihre Daten werden nicht zum Trainieren von LLMs verwendet.
Nein, die mit HeatWave bereitgestellten datenbankinternen LLMs können nicht verfeinert werden.
Nein, Sie können keine eigenen LLMs oder Einbettungsmodelle mitbringen. Sie können jedoch die externen LLMs oder Einbettungsmodelle aufrufen, die über OCI Generative AI verfügbar sind, wenn Sie HeatWave GenAI auf OCI ausführen, und über Amazon Bedrock, wenn Sie HeatWave GenAI auf AWS ausführen.
Basierend auf unseren Tests sind die Ergebnisse für Anwendungsfälle, die auf HeatWave Vector Store basieren, mit nicht quantisierten LLMs vergleichbar. Sie können die Modelle einfach testen, um die Leistung und die Qualität der Ergebnisse zu bewerten.
Sie müssen die Einbettungen nur einmal generieren – sie werden dann im HeatWave Vector Store gespeichert. Änderungen an unstrukturierten Dokumenten im Objektspeicher lösen automatisch Aktualisierungen der zugehörigen Vektoreinbettungen aus.
Ja, die Unterstützung der optischen Zeichenerkennung ermöglicht es HeatWave Vector Store, gescannte Inhalte, die als Bilder gespeichert sind, in Textdaten umzuwandeln, die analysiert werden können, um beispielsweise Ähnlichkeitssuchen durchzuführen.