Generative AI – Servicefunktionen

 

modelle

Zu den neuen Modellen von Cohere und Meta für OCI Generative AI gehören folgende:

  • Cohere Command: Command ist das Flaggschiff von Cohere im Bereich der Texterstellung. Es ist in zwei Größen erhältlich: 6 Milliarden Parameter und 52 Milliarden Parameter. Das erstgenannte Modell zeichnet sich durch geringere Latenzzeiten und Kosten aus, während das zweite Modell mehr Genauigkeit bietet.
  • Cohere Summarize: Summarize liefert hochwertige Zusammenfassungen, die die wichtigsten Informationen aus Ihren Dokumenten genau erfassen.
  • Cohere Embed: Diese englischen und mehrsprachigen Einbettungsmodelle (v3) konvertieren Text in eine Vektoreinbettungsdarstellung. Die „Light“-Versionen von Embed sind kleiner und schneller (nur auf Englisch verfügbar).
  • Meta Llama 2: Llama 2 ist eine Sammlung von Texterstellungsmodellen mit bis zu 70 Milliarden Parametern. Es ist das führende Open-Source-LLM, das für Forschung und kommerzielle Nutzung kostenlos ist.

Dedicated AI-Cluster

Mit Dedicated AI-Clustern können Sie grundlegende Modelle auf dedizierten GPUs hosten, die nur Ihnen zur Verfügung stehen. Solche Cluster bieten Ihnen eine stabile Leistung mit hohem Durchsatz, die für Produktionsanwendungen erforderlich ist, und unterstützen das Hosting und die Feinabstimmung von Workloads. OCI Generative AI ermöglicht es Ihnen, Ihren Cluster ohne Ausfallzeiten zu skalieren, um Volumenschwankungen zu bewältigen. Bis zu 50 benutzerdefinierte, feinabgestimmte Modelle können auf demselben dedizierten Hosting-Cluster gehostet werden, solange diese feinabgestimmten Modelle alle dasselbe Basismodell verwenden.

LangChain-Integration

OCI Generative AI enthält LangChain, ein Open-Source-Framework, das für die Entwicklung neuer Schnittstellen für generative KI-Anwendungen auf der Grundlage von Sprachmodellen verwendet werden kann. LangChain vereinfacht den Austausch von Abstraktionen und Komponenten, die für die Arbeit mit Sprachmodellen erforderlich sind.

Generative KI-Vorgänge

OCI Generative AI bietet Kontrollmechanismen für die Inhaltsmoderation, den Austausch von Endpunktmodellen ohne Ausfallzeiten sowie die Möglichkeit, Endpunkte zu deaktivieren und zu aktivieren. Für jeden Modell-Endpunkt erfasst OCI Generative AI zudem eine Reihe von Analysen, darunter Anrufstatistiken, verarbeitete Token, Fehlerzahlen und mehr.

OCI Generative AI für Oracle Cloud Applications

Durch die direkte Einbettung von mit OCI Generative AI erstellten Funktionen in seine Geschäftsanwendungen stellt Oracle seinen Kunden ganz einfach sofort KI-gesteuerte Funktionen ohne komplexe Integrationen zur Verfügung.

Weitere Informationen zu Oracle Cloud Applications