Retrieval-Augmented Generation (RAG)は、簡単な問合せに役立ちます。しかし、問合せが複雑で、多段階の推論と意思決定が必要な場合にはどうでしょうか。たとえば、FAQを取得するだけでなく、問題をトラブルシューティングできるサポート・チャットボットが役立つ場合です。
このソリューションでは、マルチエージェントRAGパイプラインを設定し、それをOracle Cloud Infrastructure(OCI)にデプロイして、問合せにインテリジェントに応答します。大型言語モデル(LLM)エージェントは、AIの応答を計画、調査、および理由します。この思考連鎖(CoT)プロセスは、人間の問題解決をエミュレートします。Gradioインタフェースは、データ処理を調整します。複数のデータ・ソースは、オープン・ソース・ツールを使用して、ベクトルとしてアップロード、取り込みおよび格納されます。Gradioは、自然言語問合せを入力するためのチャット・インタフェースも提供します。
GradioでCoTビジュアライゼーションを使用すると、各エージェントが最終的な合成レスポンスを提供するために行ったステップおよび決定が表示されます。このソリューションは、エージェントAIがローカル・モデルとクラウド・ベースのモデルの両方の推論機能をどのように強化できるかを示す簡単な例を提供します。