يمكن أن يكون الإنشاء المعزز للاسترجاع (RAG) مفيدًا للاستعلامات المباشرة. ولكن ماذا لو كانت الاستعلامات معقدة، وتتطلب استدلالًا متعدد الخطوات واتخاذ قرارات؟ وهذا عندما يكون، على سبيل المثال، روبوت محادثة للدعم يمكنه استكشاف المشكلات وإصلاحها، وليس فقط استرجاع الأسئلة الشائعة، أكثر فائدة.
في هذا الحل، سنقوم بإعداد مسار RAG متعدد الوكلاء ونشره على Oracle Cloud Infrastructure (OCI) للاستجابة بذكاء للاستعلام. يقوم وكلاء نموذج اللغة الكبير (LLM) بتخطيط استجابة الذكاء الاصطناعي وبحثها وسببها؛ تحاكي عملية سلسلة التفكير هذه (CoT) حل المشكلات البشرية. تعمل واجهة Gradio على تنسيق معالجة البيانات - يتم تحميل مصادر بيانات متعددة واستيعابها وتخزينها كموجهات باستخدام أدوات مفتوحة المصدر. يوفر Gradio أيضًا واجهة المحادثة لإدخال استعلام اللغة الطبيعية.
باستخدام التمثيل المرئي CoT في Gradio، سترى الخطوات والقرارات التي يتخذها كل وكيل لتقديم الاستجابة النهائية المجمعة. يوفر هذا الحل مثالاً سهلاً للمتابعة حول كيفية تحسين الذكاء الاصطناعي الوكيل لإمكانات التفكير لكل من النماذج المحلية والقائمة على السحابة.