Dans le paysage technologique actuel, nous pouvons tirer parti de la recherche et des statistiques, en tirant des flux de données pour l'analyse et en tirant des informations pour prendre des décisions en temps réel. Cependant, les nouvelles informations peuvent être difficiles à analyser et à contextualiser, même pour les solutions d'analyse les plus robustes. C'est là que la génération augmentée par récupération (RAG) est utile, ce qui vous permet d'augmenter les connaissances d'un modèle de langage volumineux sans le réentraîner lorsque de nouvelles informations sont disponibles. Cela met à jour votre modèle avec des données plus récentes, ce qui le rend plus capable, avec un effort minimal.
Les agents d'IA générative Oracle Cloud Infrastructure (OCI) vous permettent de le faire. Dans cet exemple, nous allons télécharger nos documents, traiter ces données, les placer dans une banque de vecteurs (via OCI Search avec OpenSearch), créer un cluster Redis à des fins de mise en cache et vous fournir un moyen d'utiliser les données via un chatbot.
Pour l'infrastructure, les services OCI suivants sont présents :