HeatWave GenAI

Oracle HeatWave GenAI fournit une IA générative intégrée et automatisée avec des grands modèles de langage (LLM) dans la base de données, un stockage vectoriel automatisé dans la base de données, un traitement vectoriel scale-out et la possibilité d'avoir des conversations contextuelles en langage naturel, ce qui vous permet de tirer parti de l'IA générative sans expertise en IA, ni déplacement de données, ni frais supplémentaires.

Regarder la démonstration (5:40)

Ne manquez pas la présentation d'Oracle CloudWorld par Edward Screven, architecte en chef d'entreprise d'Oracle, le 11 septembre à 8 h 30 (heure normale du Pacifique) : « Créer des applications d'IA génératives intégrées et automatisées avec HeatWave GenAI ».

Pourquoi utiliser HeatWave GenAI ?

  • Utilisez rapidement l'IA générative en tout lieu

    Utilisez des LLM optimisés dans la base de données entre les clouds et les régions pour extraire des données et générer ou résumer du contenu, sans avoir à sélectionner ni à intégrer de LLM externes.

  • Obtenir facilement des réponses plus précises et pertinentes

    Demandez aux LLM de faire des recherches dans vos documents propriétaires pour obtenir des réponses plus précises et contextuellement pertinentes, sans expertise en IA ni déplacement de données vers une base de données vectorielle distincte. HeatWave GenAI automatise la génération d'intégration.

  • Discutez en langage naturel

    Obtenez des informations rapides à partir de vos documents via des conversations en langage naturel. L'interface de discussion HeatWave conserve le contexte pour permettre des conversations de type humain avec des questions de suivi.

Principales fonctionnalités de HeatWave GenAI

LLM dans la base de données

Utilisez les LLM intégrés et optimisés dans toutes les régions Oracle Cloud Infrastructure (OCI), dans la région dédiée OCI et dans les clouds et obtenez des résultats cohérents avec des performances prévisibles dans tous les déploiements. Réduisez les coûts d'infrastructure en éliminant le besoin de provisionner les GPU.

Intégré à l'aide d'OCI Generative AI

Accédez à des modèles fondamentaux pré-entraînés à partir de Cohere et de Meta via le service OCI Generative AI.

HeatWave Chat

Tenez des conversations contextuelles en langage naturel informées par vos données non structurées dans HeatWave Vector Store. Utilisez le navigateur Lakehouse intégré pour aider les LLM à effectuer des recherches dans des documents spécifiques, ce qui vous permet de réduire les coûts tout en obtenant des résultats plus précis plus rapidement.

Stockage vectoriel dans la base de données

HeatWave Vector Store héberge vos documents propriétaires dans différents formats, et agit en tant que base de connaissances pour la génération augmentée de récupération (RAG) afin de vous aider à obtenir des réponses plus précises et pertinentes sur le plan contextuel, sans déplacer les données vers une base de données vectorielle distincte.

Génération automatisée d'intégrations

Tirez parti du pipeline automatisé pour découvrir et ingérer des documents propriétaires dans HeatWave Vector Store, ce qui facilite l'utilisation du magasin de vecteurs par les développeurs et les analystes sans expertise en IA.

Traitement vectoriel évolutif

Le traitement vectoriel est parallélisé sur jusqu'à 512 noeuds de cluster HeatWave et exécuté à la bande passante de la mémoire, ce qui permet d'obtenir des résultats rapides avec une probabilité réduite de perte de précision.

Points de vue des clients sur HeatWave GenAI

  • « HeatWave GenAI facilite grandement l'utilisation de l'IA générative. Grâce à la prise en charge des LLM dans la base de données et de la création de vecteurs dans la base de données entraîne, la complexité des applications est fortement réduite, la latence d'inférence est prévisible et, surtout, nous n'avons à subir aucun coût supplémentaire pour utiliser les LLM ou créer les intégrations. C'est une véritable démocratisation de l'IA générative, et nous pensons qu'elle se traduira par la création d'applications plus riches avec HeatWave GenAI et des gains de productivité significatifs pour nos clients. »

    Vijay Sundhar, PDG, SmarterD

  • « Nous utilisons beaucoup HeatWave AutoML dans la base de données pour faire diverses recommandations à nos clients. La prise en charge par HeatWave des LLM dans la base de données et du magasin de vecteurs dans la base de données est un point qui le démarque. La possibilité d'intégrer l'IA générative à AutoML différencie davantage HeatWave dans le secteur, ce qui nous permet d'offrir de nouveaux types de fonctionnalités à nos clients. La synergie avec AutoML améliore également les performances et la qualité des résultats du LLM. »

    Safarath Shafi, PDG, EatEasy

  • « Les LLM HeatWave dans la base de données, le stockage de vecteurs dans la base de données, le traitement de vecteurs en mémoire évolutif et le chat HeatWave sont des fonctionnalités très différenciées d'Oracle qui démocratisent l'IA générative et rendent son utilisation très simple, sécurisée et peu coûteuse. L'utilisation de HeatWave et AutoML pour nos besoins d'entreprise a déjà transformé notre entreprise de plusieurs façons, et l'introduction de cette innovation d'Oracle stimulera probablement la croissance d'une nouvelle classe d'applications dans lesquelles les clients cherchent des moyens d'exploiter l'IA générative pour leur contenu d'entreprise. »

    Eric Aguilar, fondateur, Aiwifi

Qui peut bénéficier de l'utilisation de HeatWave GenAI ?

  • Les développeurs peuvent fournir des applications avec l'IA intégrée

    Les LLM intégrés et HeatWave Chat vous permettent de fournir des applications préconfigurées pour les conversations contextuelles en langage naturel. Il n'est pas nécessaire de recourir à des LLM et à des GPU externes.

  • Les analystes peuvent rapidement obtenir de nouvelles informations

    HeatWave GenAI peut vous aider à converser facilement avec vos données, à effectuer des recherches de similarité dans les documents et à récupérer des informations à partir de vos données propriétaires.

  • L'informatique peut accélérer l'innovation en matière d'IA

    Offrez aux développeurs et aux équipes commerciales des fonctionnalités et une automatisation intégrées pour tirer parti de l'IA générative. Activez facilement les conversations en langage naturel et la RAG.

Vous pouvez utiliser les LLM dans la base de données pour générer ou résumer du contenu en fonction de vos documents non structurés. Les utilisateurs peuvent poser des questions en langage naturel via des applications, et le LLM traitera la demande et fournira le contenu.


Diagramme de génération de contenu, description ci-dessous :

Un utilisateur pose une question en langage naturel : « Pouvez-vous générer un résumé de cette présentation de solution ? » Le grand modèle de langage (LLM) traite cette entrée et génère le résumé en tant que sortie.



Vous pouvez associer la puissance de l'IA générative à d'autres fonctionnalités HeatWave intégrées, telles que l'apprentissage automatique, afin de réduire les coûts et d'obtenir des résultats plus précis plus rapidement. Dans cet exemple, une entreprise de fabrication suit cette démarche pour la maintenance prédictive. Les ingénieurs peuvent utiliser Oracle HeatWave AutoML pour générer automatiquement un rapport sur les journaux de production anormaux et HeatWave GenAI permet de déterminer rapidement la cause première du problème en permettant aux ingénieurs de poser simplement une question en langage naturel, au lieu d'analyser manuellement les journaux.


Diagramme de génération d'analyse, description ci-dessous :

Un utilisateur demande via HeatWave Chat : « Quel est le principal problème dans cette collection de journaux ? Fournissez un résumé en deux phrases. » Tout d'abord, HeatWave AutoML produit une liste filtrée de journaux anormaux en fonction de tous les journaux de production qu'il ingère en permanence. Ensuite, le magasin de vecteurs HeatWave fournit un contexte supplémentaire au LLM en fonction de la base de connaissances des journaux. Le LLM traite cette invite augmentée, produit un rapport et fournit à l'utilisateur une réponse détaillée expliquant le problème en langage naturel.



Les chatbots peuvent utiliser la RAG pour aider à répondre aux questions des employés sur les politiques internes de l'entreprise, par exemple. Les documents internes détaillant les stratégies sont stockés en tant qu'intégrations dans HeatWave Vector Store. Pour une requête utilisateur donnée, la banque de vecteurs aide à identifier les documents les plus similaires en effectuant une recherche de similarité par rapport aux incorporations stockées. Ces documents sont utilisés pour compléter l'invite donnée au LLM afin qu'il fournisse une réponse exacte.


Diagramme RAG, description ci-dessous :

Un utilisateur demande via HeatWave Chat : « Quels ordinateurs portables puis-je commander et quel est le processus ? ». HeatWave traite la question en accédant aux documents de stratégie internes hébergés dans HeatWave Vector Store. Il fournit ensuite une invite augmentée au LLM qui peut générer la réponse « Voici la liste des fournisseurs approuvés et les étapes à suivre pour passer commande. »



Les développeurs peuvent créer des applications en tirant parti de la puissance combinée de l'apprentissage automatique intégré, de l'IA générative et du magasin de vecteurs pour fournir des recommandations personnalisées. Dans cet exemple, l'application utilise le système de recommandation HeatWave AutoML pour recommander des restaurants en fonction des préférences de l'utilisateur ou de ce que l'utilisateur a commandé précédemment. Avec HeatWave Vector Store, l'application peut également effectuer des recherches dans les menus des restaurants au format PDF pour suggérer des plats spécifiques, offrant ainsi une plus grande valeur aux clients.


Diagramme RAG améliorée avec l'apprentissage automatique, description ci-dessous :

Un utilisateur demande via HeatWave Chat : « Quels plats végétaliens me proposez-vous aujourd'hui ? » Tout d'abord, le système de recommandation HeatWave AutoML suggère une liste de restaurants en fonction de ce que l'utilisateur a commandé précédemment. Ensuite, HeatWave Vector Store fournit une invite augmentée au LLM en fonction des menus des restaurants qu'il contient. Le LLM peut alors générer une recommandation de plats personnalisée en langage naturel.



26 juin 2024

Annonce de la disponibilité générale de HeatWave GenAI

Nipun Agarwal, Vice-Président senior chez Oracle pour le développement de HeatWave

HeatWave a permis aux entreprises d'exécuter le traitement des transactions, les analyses sur les entrepôts de données et les lacs de données, ainsi que l'apprentissage automatique au sein d'un service cloud unique et entièrement géré. Aujourd'hui, nous annonçons la disponibilité générale de HeatWave GenAI, avec des grands modèles de langage (LLM) dans la base de données, une banque de vecteurs automatisée dans la base de données, un traitement de vecteurs évolutif et la possibilité d'avoir des conversations contextuelles en langage naturel.

Lire la suite de l'article

Découvrez ce que les meilleurs analystes du secteur pensent de HeatWave GenAI

  • Logo NAND Research

    « Avec les LLM dans la base de données prêts à l'emploi et un magasin de vecteurs entièrement automatisé prêt pour le traitement vectoriel dès le premier jour, HeatWave GenAI offre une simplicité de l'IA et une performance des prix inégalables par ses concurrents tels que Snowflake, Google BigQuery et Databricks. »

    Steve McDowell
    Analyste principal et partenaire fondateur, NAND Research
  • Logo de Constellation Research

    « L'innovation d'ingénierie de HeatWave continue de concrétiser la vision d'une base de données cloud universelle. La dernière version est l'IA générative de style HeatWave, qui inclut l'intégration d'un magasin de vecteurs automatisé dans la base de données et de LLM dans la base de données directement dans le noyau HeatWave. Les développeurs peuvent ainsi créer de nouvelles classes d'applications lorsqu'ils combinent des éléments HeatWave. »

    Holger Mueller
    Vice President and Principal Analyst, Constellation Research
  • Logo The Futurum Group

    HeatWave GenAI a fourni des performances de traitement vectoriel 30 fois plus rapides que Snowflake, 18 fois plus rapides que Google BigQuery et 15 fois plus rapides que Databricks, à un coût jusqu'à 6 fois inférieur. Pour toute organisation qui prend au sérieux les charges de travail d'IA générative hautes performances, dépenser les ressources de l'entreprise dans l'une de ces trois offres de bases de données vectorielles ou autres équivaut à gaspiller de l'argent, puis à essayer de se convaincre que c'était une bonne idée. »

    Ron Westfall
    Analyste senior et Directeur de recherche chez The Futurum Group
  • logo dbInsight

    « HeatWave fait un grand pas en avant pour rendre l'IA générative et la génération augmentée de récupération (RAG) plus accessibles, en absorbant toute la complexité liée à la création d'intégrations vectorielles. Les développeurs indiquent simplement l'emplacement des fichiers source situés dans le stockage d'objets cloud, puis HeatWave gère la charge lourde. »

    Tony Baer
    Fondateur et PDG, dbInsight

Premiers pas avec HeatWave GenAI

Consulter la documentation

Créez facilement des applications GenAI

Suivez les instructions pas à pas et utilisez le code que nous fournissons pour créer rapidement et facilement des applications optimisées par HeatWave GenAI.

Inscrivez-vous pour ce service

Inscrivez-vous pour un essai gratuit de HeatWave GenAI. Vous recevrez 300 USD de crédit cloud pour tester ses capacités pendant 30 jours.

Contactez l’équipe commerciale

Vous souhaitez en savoir plus sur HeatWave GenAI ? Laissez l’un de nos experts vous aider.