Oracle HeatWave GenAI fournit une IA générative intégrée et automatisée avec des grands modèles de langage (LLM) dans la base de données, un stockage vectoriel automatisé dans la base de données, un traitement vectoriel scale-out et la possibilité d'avoir des conversations contextuelles en langage naturel, ce qui vous permet de tirer parti de l'IA générative sans expertise en IA, ni déplacement de données, ni frais supplémentaires.
Ne manquez pas la présentation d'Oracle CloudWorld par Edward Screven, architecte en chef d'entreprise d'Oracle, le 11 septembre à 8 h 30 (heure normale du Pacifique) : « Créer des applications d'IA génératives intégrées et automatisées avec HeatWave GenAI ».
Utilisez des LLM optimisés dans la base de données entre les clouds et les régions pour extraire des données et générer ou résumer du contenu, sans avoir à sélectionner ni à intégrer de LLM externes.
Demandez aux LLM de faire des recherches dans vos documents propriétaires pour obtenir des réponses plus précises et contextuellement pertinentes, sans expertise en IA ni déplacement de données vers une base de données vectorielle distincte. HeatWave GenAI automatise la génération d'intégration.
Obtenez des informations rapides à partir de vos documents via des conversations en langage naturel. L'interface de discussion HeatWave conserve le contexte pour permettre des conversations de type humain avec des questions de suivi.
Utilisez les LLM intégrés et optimisés dans toutes les régions Oracle Cloud Infrastructure (OCI), dans la région dédiée OCI et dans les clouds et obtenez des résultats cohérents avec des performances prévisibles dans tous les déploiements. Réduisez les coûts d'infrastructure en éliminant le besoin de provisionner les GPU.
Accédez à des modèles fondamentaux pré-entraînés à partir de Cohere et de Meta via le service OCI Generative AI.
Tenez des conversations contextuelles en langage naturel informées par vos données non structurées dans HeatWave Vector Store. Utilisez le navigateur Lakehouse intégré pour aider les LLM à effectuer des recherches dans des documents spécifiques, ce qui vous permet de réduire les coûts tout en obtenant des résultats plus précis plus rapidement.
HeatWave Vector Store héberge vos documents propriétaires dans différents formats, et agit en tant que base de connaissances pour la génération augmentée de récupération (RAG) afin de vous aider à obtenir des réponses plus précises et pertinentes sur le plan contextuel, sans déplacer les données vers une base de données vectorielle distincte.
Tirez parti du pipeline automatisé pour découvrir et ingérer des documents propriétaires dans HeatWave Vector Store, ce qui facilite l'utilisation du magasin de vecteurs par les développeurs et les analystes sans expertise en IA.
Le traitement vectoriel est parallélisé sur jusqu'à 512 noeuds de cluster HeatWave et exécuté à la bande passante de la mémoire, ce qui permet d'obtenir des résultats rapides avec une probabilité réduite de perte de précision.
« HeatWave GenAI facilite grandement l'utilisation de l'IA générative. Grâce à la prise en charge des LLM dans la base de données et de la création de vecteurs dans la base de données entraîne, la complexité des applications est fortement réduite, la latence d'inférence est prévisible et, surtout, nous n'avons à subir aucun coût supplémentaire pour utiliser les LLM ou créer les intégrations. C'est une véritable démocratisation de l'IA générative, et nous pensons qu'elle se traduira par la création d'applications plus riches avec HeatWave GenAI et des gains de productivité significatifs pour nos clients. »
Vijay Sundhar, PDG, SmarterD
« Nous utilisons beaucoup HeatWave AutoML dans la base de données pour faire diverses recommandations à nos clients. La prise en charge par HeatWave des LLM dans la base de données et du magasin de vecteurs dans la base de données est un point qui le démarque. La possibilité d'intégrer l'IA générative à AutoML différencie davantage HeatWave dans le secteur, ce qui nous permet d'offrir de nouveaux types de fonctionnalités à nos clients. La synergie avec AutoML améliore également les performances et la qualité des résultats du LLM. »
Safarath Shafi, PDG, EatEasy
« Les LLM HeatWave dans la base de données, le stockage de vecteurs dans la base de données, le traitement de vecteurs en mémoire évolutif et le chat HeatWave sont des fonctionnalités très différenciées d'Oracle qui démocratisent l'IA générative et rendent son utilisation très simple, sécurisée et peu coûteuse. L'utilisation de HeatWave et AutoML pour nos besoins d'entreprise a déjà transformé notre entreprise de plusieurs façons, et l'introduction de cette innovation d'Oracle stimulera probablement la croissance d'une nouvelle classe d'applications dans lesquelles les clients cherchent des moyens d'exploiter l'IA générative pour leur contenu d'entreprise. »
Eric Aguilar, fondateur, Aiwifi
Les LLM intégrés et HeatWave Chat vous permettent de fournir des applications préconfigurées pour les conversations contextuelles en langage naturel. Il n'est pas nécessaire de recourir à des LLM et à des GPU externes.
HeatWave GenAI peut vous aider à converser facilement avec vos données, à effectuer des recherches de similarité dans les documents et à récupérer des informations à partir de vos données propriétaires.
Offrez aux développeurs et aux équipes commerciales des fonctionnalités et une automatisation intégrées pour tirer parti de l'IA générative. Activez facilement les conversations en langage naturel et la RAG.
Vous pouvez utiliser les LLM dans la base de données pour générer ou résumer du contenu en fonction de vos documents non structurés. Les utilisateurs peuvent poser des questions en langage naturel via des applications, et le LLM traitera la demande et fournira le contenu.
Vous pouvez associer la puissance de l'IA générative à d'autres fonctionnalités HeatWave intégrées, telles que l'apprentissage automatique, afin de réduire les coûts et d'obtenir des résultats plus précis plus rapidement. Dans cet exemple, une entreprise de fabrication suit cette démarche pour la maintenance prédictive. Les ingénieurs peuvent utiliser Oracle HeatWave AutoML pour générer automatiquement un rapport sur les journaux de production anormaux et HeatWave GenAI permet de déterminer rapidement la cause première du problème en permettant aux ingénieurs de poser simplement une question en langage naturel, au lieu d'analyser manuellement les journaux.
Les chatbots peuvent utiliser la RAG pour aider à répondre aux questions des employés sur les politiques internes de l'entreprise, par exemple. Les documents internes détaillant les stratégies sont stockés en tant qu'intégrations dans HeatWave Vector Store. Pour une requête utilisateur donnée, la banque de vecteurs aide à identifier les documents les plus similaires en effectuant une recherche de similarité par rapport aux incorporations stockées. Ces documents sont utilisés pour compléter l'invite donnée au LLM afin qu'il fournisse une réponse exacte.
Les développeurs peuvent créer des applications en tirant parti de la puissance combinée de l'apprentissage automatique intégré, de l'IA générative et du magasin de vecteurs pour fournir des recommandations personnalisées. Dans cet exemple, l'application utilise le système de recommandation HeatWave AutoML pour recommander des restaurants en fonction des préférences de l'utilisateur ou de ce que l'utilisateur a commandé précédemment. Avec HeatWave Vector Store, l'application peut également effectuer des recherches dans les menus des restaurants au format PDF pour suggérer des plats spécifiques, offrant ainsi une plus grande valeur aux clients.
La recherche de similarité se concentre sur la recherche de contenu associé basé sur la sémantique. La recherche de similarité va au-delà des recherches de mots-clés simples en tenant compte de la signification sous-jacente au lieu de rechercher uniquement les balises appliquées. Dans cet exemple, un avocat souhaite identifier rapidement une clause potentiellement problématique dans les contrats.
HeatWave a permis aux entreprises d'exécuter le traitement des transactions, les analyses sur les entrepôts de données et les lacs de données, ainsi que l'apprentissage automatique au sein d'un service cloud unique et entièrement géré. Aujourd'hui, nous annonçons la disponibilité générale de HeatWave GenAI, avec des grands modèles de langage (LLM) dans la base de données, une banque de vecteurs automatisée dans la base de données, un traitement de vecteurs évolutif et la possibilité d'avoir des conversations contextuelles en langage naturel.
Lire la suite de l'article« Avec les LLM dans la base de données prêts à l'emploi et un magasin de vecteurs entièrement automatisé prêt pour le traitement vectoriel dès le premier jour, HeatWave GenAI offre une simplicité de l'IA et une performance des prix inégalables par ses concurrents tels que Snowflake, Google BigQuery et Databricks. »
« L'innovation d'ingénierie de HeatWave continue de concrétiser la vision d'une base de données cloud universelle. La dernière version est l'IA générative de style HeatWave, qui inclut l'intégration d'un magasin de vecteurs automatisé dans la base de données et de LLM dans la base de données directement dans le noyau HeatWave. Les développeurs peuvent ainsi créer de nouvelles classes d'applications lorsqu'ils combinent des éléments HeatWave. »
HeatWave GenAI a fourni des performances de traitement vectoriel 30 fois plus rapides que Snowflake, 18 fois plus rapides que Google BigQuery et 15 fois plus rapides que Databricks, à un coût jusqu'à 6 fois inférieur. Pour toute organisation qui prend au sérieux les charges de travail d'IA générative hautes performances, dépenser les ressources de l'entreprise dans l'une de ces trois offres de bases de données vectorielles ou autres équivaut à gaspiller de l'argent, puis à essayer de se convaincre que c'était une bonne idée. »
« HeatWave fait un grand pas en avant pour rendre l'IA générative et la génération augmentée de récupération (RAG) plus accessibles, en absorbant toute la complexité liée à la création d'intégrations vectorielles. Les développeurs indiquent simplement l'emplacement des fichiers source situés dans le stockage d'objets cloud, puis HeatWave gère la charge lourde. »
Lisez nos derniers articles de blog pour obtenir des conseils, des explications techniques et des meilleures pratiques.
Suivez les instructions pas à pas et utilisez le code que nous fournissons pour créer rapidement et facilement des applications optimisées par HeatWave GenAI.
Inscrivez-vous pour un essai gratuit de HeatWave GenAI. Vous recevrez 300 USD de crédit cloud pour tester ses capacités pendant 30 jours.
Vous souhaitez en savoir plus sur HeatWave GenAI ? Laissez l’un de nos experts vous aider.