Fonctionnalités de Generative AI Service

 

Modèles

Voici les nouveaux modèles de Cohere and Meta disponibles avec OCI Generative AI

  • Cohere Command : Command est le vaisseau amiral de Cohere pour la génération de texte. Il est disponible en deux tailles : 6 milliards de paramètres et 52 milliards de paramètres. Le premier a une latence et des coûts inférieurs tandis que le second modèle offre une meilleure précision.
  • Cohere Summarize : Summarize rédige des résumés de haute qualité qui capturent avec précision les informations les plus importantes de vos documents.
  • Cohere Embed : Ces modèles de vectorisation en anglais et multilingues (v3) convertissent le texte en représentations vectorielles. Les versions « Light » d'Embed sont plus petites et plus rapides, mais elles ne sont disponibles qu'en anglais.
  • Meta Llama 2 : Llama 2 est un ensemble de modèles de génération de texte avec jusqu'à 70 milliards de paramètres. C'est le grand modèle de langage (LLM) gratuit n°1 du monde open source pour la recherche et l'utilisation commerciale.

Clusters d'IA dédiés

Avec les clusters d'IA dédiés, vous pouvez héberger des modèles de base sur des GPU dédiés à votre utilisation. Ces clusters offrent les performances élevées et la stabilité requises pour les cas d'utilisation de production. Ils peuvent prendre en charge l'hébergement et des workloads d'affinage. OCI Generative AI vous permet d'agrandir votre cluster sans temps d'arrêt pour gérer la fluctuation du volume à traiter. Jusqu'à 50 modèles personnalisés et affinés peuvent être hébergés sur le même cluster d'hébergement dédié tant que ces modèles affinés partagent tous le même modèle de base.

Intégration avec LangChain

OCI Generative AI est intégré à LangChain, un framework open source qui permet de développer de nouvelles interfaces pour les applications d'IA générative basées sur des modèles linguistiques. LangChain facilite l'échange des abstractions et des composants nécessaires à l'utilisation des modèles de langage.

Opérations d'IA génératives

OCI Generative AI fournit des contrôles de modération de contenu, un échange de modèles sans temps d'arrêt et des fonctionnalités de désactivation et d'activation des points de terminaison. Pour chaque point de terminaison de modèle, OCI Generative AI capture également une série de mesures, notamment les statistiques d'appel, les jetons traités, le nombre d'erreurs, etc.

OCI Generative AI pour les applications Oracle Cloud

En intégrant des fonctionnalités créées avec OCI Generative AI directement dans ses applications métiers, Oracle facilite l'accès instantané des clients aux fonctionnalités basées sur l'IA sans intégrations complexes.

En savoir plus sur les applications cloud d'Oracle