جيفري إريكسون | كاتب أول | 21 نوفمبر 2024
أصبحت نماذج اللغات الكبيرة للأغراض العامة، أو نماذج LLM شائعة لدى الجمهور لأنها يمكن أن تناقش مجموعة واسعة من الموضوعات وتكتب أوراق بحثية، وبطاقات شُكر، والعديد من المهام الأخرى. مع ذلك، لن تكون كذلك في مجال الأعمال التجارية هذه النواتج العامة. يحتاج LLM الذي من المتوقع أن يوفر الدعم الفني لأداة معينة، على سبيل المثال إلى الاعتماد على المعرفة الخاصة بالمجال.
توجد حاليًا طريقتان لمساعدة نماذج الذكاء الاصطناعي التوليدي في تقديم استجابات تعكس هذا النوع من الخبرة: الضبط الدقيق والتوليد المعزز بالاسترجاع أو RAG. يصحب كل منهما مزايا وتحديات. دعونا نلقي نظرة أعمق على هذه الخيارات لفهم طريقة عملها ومتى تستخدمها.
النقاط الرئيسة
إن RAG اختصارًا للتوليد المعزز بالاسترجاع، هو إطار معماري طوره باحثون في Meta لمساعدة نماذج الذكاء الاصطناعي للأغراض العامة في تقديم مخرجات ذات صلة ومُفيدة للمؤسسات. تقوم RAG بذلك من خلال منح نموذج لغة كبير، أو LLM، إمكانية الوصول إلى قاعدة معارف داخلية يمكن استخدامها لزيادة بيانات التدريب الأصلية. تكون النتيجة في نظام الذكاء الاصطناعي الذي يجمع بين الطلاقة اللغوية في LLM والبيانات المحلية لتقديم استجابات مستهدفة ومناسبة للسياق. يعمل هذا النهج على عكس الضبط الدقيق لنموذج الذكاء الاصطناعي، دون تعديل النموذج الأساس نفسه.
استخدم RAG عندما يكون من المهم لاستجابات الذكاء الاصطناعي العامة توفير بيانات مُحدَّثة أو خاصة بالمؤسسة لم تكن جزءًا من تدريب LLM. على سبيل المثال، إذا كانت الشركة لديها مجموعة كبيرة من المعلومات الموثوقة حول منتجاتها أو عملياتها اليومية، فتوفر بنية RAG هذه البيانات لتعزيز المطالبات والاستجابات التي تمر عبر LLM، مما يجعل المخرجات أفيد وقابلة للتحقق ودقيقة. يمكن أن يؤدي ذلك إلى تحسين أتمتة مكتب الخدمة أو فحوصات توافر المنتجات في البيع بالتجزئة أو حتى الرعاية الصحية، إذ يمكن أن تتوفر ملاحظات الأطباء بسرعة للمرضى أو الأطباء الآخرين.
تشمل المزايا الشائعة لـ RAG عبر المجالات استرجاع البيانات بشكل أفضل وأكمل، ودعم العملاء المحسن، والقدرة على إنشاء محتوى مُخصص. من خلال استكمال نماذج اللغات الكبيرة بالمعلومات الحالية، يمكن للمؤسسات نشر وكلاء الذكاء الاصطناعي لتوفير إجابات فورية وذات صلة بالسياق لاستعلامات المستخدم، مما يقلل من الحاجة إلى التدخل البشري. يسمح تنوع استخدامات RAG بأن يتكيف مع مجموعة واسعة من التطبيقات، بما في ذلك ما يلي:
يعني الضبط الدقيق لنموذج الذكاء الاصطناعي التوليدي تناول نموذج للأغراض العامة، مثل Claude 2 من Anthropic أو Command from Cohere أو Llama 2 من Meta؛ مع منحه جولات إضافية من التدريب على مجموعة بيانات أصغر خاصة بالمجال؛ وضبط معلمات النموذج بناءً على هذا التدريب. يساعد هذا الضبط النموذج في الأداء بشكل أفضل في مهام مُحددة لأنه تم تكييفه مع الفروق الدقيقة والمصطلحات في مجال معين، مثل الترميز أ الصو الرعايةحية.
اختر الضبط الدقيق عندما يحتاج نموذج LLM إلى أن يكون مُبدعًا في مجال معين. من خلال التدريب الإضافي، يمكن لـ LLM فهم المطالبات بشكل أفضل وتقديم المخرجات التي تعكس الفروق الدقيقة والمصطلحات في مجال معين. تحتاج إلى الوصول إلى مجموعة بيانات كبيرة أو مخزن من المستندات التي تم تنسيقها لعملية التدريب، لكن يستحق الضبط الدقيق الجهد لأنه يسمح بمزيد من التحكم في نمط المحتوى الذي تم إنشاؤه ونغمته وطريقته. يمكن أن يؤتي ثماره في المواد التسويقية أو تفاعلات العملاء. يمكن أن يكون الضبط الدقيق، مثل RAG مفيدًا أيضًا في الطب والترميز وغيرها من المجالات عالية التخصص.
إن الضبط الدقيق عملية تكييف نموذج الذكاء الاصطناعي العام لمهمة أو مجال معين، وهي تقنية قوية يمكنها تحسين النتائج بشكل كبير لمجموعة من المؤسسات، خاصةً في الحالات التي يكون فيها التخصيص والتخصص أساسيين. فيما يلي بعض حالات الاستخدام الشائعة التي يمكن أن يكون فيها فعالاً بشكل خاص:
يجعل كل من الضبط الدقيق وRAG نماذج LLM للأغراض العامة أفيد، لكنها تفعل ذلك بطرق مُختلفة. يأتي تشبيه بسيط في أن الضبط الدقيق لـ LLM يمنحه فهمًا أعمق لمجال معين، مثل الطب أو التعليم، في حين أن اقتران LLM ببنية RAG يمنحه إمكانية الوصول إلى بيانات محلية مُحدَّثة حول استجاباتها.
لماذا لا نستخدمهما معًا للحصول على إجابات دقيقة وفي الوقت المناسب؟ إنه اتجاه متنامي وحتى يأتي مع اختصاره الخاص: RAFT، للضبط الدقيق المعزز بالاسترجاع. باستخدام هذا النهج الهجين، يتم بعد ذلك نشر نموذج تم ضبطه على بيانات المجال المُتخصصة في بنية RAG، إذ تستخدم خبرتها في المجال لاسترداد المعلومات الأكثر صلة أثناء إنشاء الاستجابة. تكون النتيجة في مخرجات دقيقة للغاية وذات صلة ومراعية للسياق.
نناقش RAFT بشكل أكبر قليلاً، لكن دعونا أولاً نصل إلى فهم أفضل للنهجين.
يساعد كل من RAG والضبط الدقيق نموذج اللغة الكبيرة في تجاوز الاستجابات العامة المستمدة من مجموعات بيانات التدريب الأصلية المُعممة. يشمل الضبط الدقيق وضع نموذج LLM عبر جولات إضافية من التدريب باستخدام مجموعات البيانات الخاصة بمجال أو مؤسسة معينة.
يغير RAG أيضًا استجابات نماذج LLM، لكنه لا يغير النموذج الأساس. بدلاً من ذلك، يستخدم نظام RAG قاعدة بيانات محلية أو مجموعة مُنسقة من المستندات للإبلاغ عن استجابات LLM، وغالبًا مع تفاصيل حتى آخر لحظة.
أدت القيود—والمزاي—من هذين النهجين بطبيعة الحال، إلى اتجاه متنامي للجمع بين نقاط قوتهما. كانت النتيجة في النهج الهجين المسمى RAFT.
يعود الاختيار بين استخدام بنية RAG أو نظام الضبط الدقيق إلى الموارد التي لديك وكيف تستخدم نموذج LLM. كما هو مذكور في الجدول أدناه، تستفيد معظم حالات الاستخدام من الجهد المبذول للجمع بين النهجين—بالنسبة إلى معظم الشركات، بمجرد بذلها جهدًا للضبط الدقيق، يصبح RAG إضافة طبيعية. لكن فيما يلي ستة أسئلة يجب طرحها لتحديد الأولويات:
| متطلبات حالة الاستخدام | RAG | الموالفة الجيدة | RAFT |
|---|---|---|---|
| يجب أن تتضمن الاستجابات معلومات محلية ومُحدثة. | نعم |
لا |
نعم |
| يجب أن تتضمن الاستجابات مستوى عالٍ من قابلية التفسير. | نعم |
لا |
نعم |
| يجب أن تعكس الاستجابات المعرفة العميقة بمجال المؤسسة. | نعم |
نعم |
نعم |
| تتمتع المؤسسة بإمكانية الوصول إلى شبكة عصبية قوية وموارد وحدة معالجة الرسومات (GPU) لتدريب الذكاء الاصطناعي. | لا |
نعم |
نعم |
| يجب أن تعكس الاستجابات نبرة المؤسسة ولغة التسويق. | لا |
نعم |
نعم |
| تمتلك المؤسسة مجموعة كبيرة ومُنظمة تنظيمًا جيدًا ومُحدثة من الوثائق لكي يستمد منها الذكاء الاصطناعي ويستشهد بها في استجابته. | نعم |
لا |
نعم |
| يتمتع نظام الذكاء الاصطناعي بإمكانية الوصول إلى موارد وقت تشغيل محدودة. | لا |
نعم |
نعم |
| تمتلك المؤسسة مجموعة بيانات كبيرة ومُنسقة ومخزن مستندات لتدريب الذكاء الاصطناعي وضبطه بشكل دقيق. | نعم |
لا |
نعم |
سواء اخترت RAG أو الضبط الدقيق أو كليهما، تتخصص Oracle في مساعدة مؤسسات مثل مؤسستك في تحقيق مكاسب في الإنتاجية باستخدام الذكاء الاصطناعي التوليدي للبنية التحتية من Oracle Cloud (OCI)، وهي خدمة مُدارة بالكامل تتضمن قوة OCI واختيار نماذج LLM مفتوحة المصدر أو المملوكة.
نسهِّل الجمع بين LLM لديك مع RAG حتى تتمكن من الحصول على استجابات مُحدَّثة تستند إلى قواعد المعارف المتنوعة لديك. عندما يحين الوقت لتشغيل نظام الضبط الدقيق، تكون البنية التحتية لـ Oracle AI خيارًا رائعًا. تجد مجموعات فائقة تتوسَّع إلى ما يصل إلى 65536 وحدة GPU—أكثر من كافية لتشغيل أحمال عمل التدريب والاستدلال الأكثر تطلبًا، مثل استجابات LLM ورؤية الكمبيوتر والتحليلات التنبؤية.
تستمر نماذج LLM للأغراض العامة في التحسن، مع تدفق مستمر للإصدارات الجديدة التي تصل من أمثال Anthropic وCohere وGoogle وMeta وغيرها الكثير. لكن بغض النظر عن مدى كفاءة نماذج الذكاء الاصطناعي هذه في التعامل مع اللغة البشرية، فإنها تحتاج دائمًا إلى طريقة لربط مجموعة المهارات هذه بالاحتياجات المحددة لحالات استخدام الأعمال. يُعد الضبط الدقيق وRAG حاليًا أفضل طريقتين للقيام بذلك. ابحث عنهم لمتابعة التطور مع تقدم نماذج الذكاء الاصطناعي والأجهزة وبُنى البيانات.
يجب أن يلعب مركز امتياز الذكاء الاصطناعي لديك دورًا محوريًا في نشر RAG. ألا تملك CoE؟ إليك طريقة الحصول على واحد وتشغيله الآن.
هل RAG أفضل من الضبط الدقيق؟
يختلف الضبط الدقيق لنموذج الذكاء الاصطناعي وRAG، مع مزاياهما وتكاليفهما الخاصة. كلاهما من الطرق الشائعة لجعل نماذج الذكاء الاصطناعي التوليدي أفيد، ويجب على كل مؤسسة اختيار الطريقة التي تناسب احتياجاتها بشكل أفضل. يوجد خيار شائع آخر هو الجمع بين النهجين، اللذين يطلق عليهما RAFT، من أجل الضبط الدقيق المعزز بالاسترجاع.
ما الأفضل من RAG؟
يُعد RAG ببساطة تقنية لمساعدة LLM في تقديم استجابات أفضل من خلال الإشارة إلى بيانات الشركة ومستنداتها. ظهرت طريقة تُسمى GraphRAG باعتبارها وسيلة لزيادة تحسين استجابات LLM بما يتجاوز ما يمكن أن تفعله بنية RAG بمفردها، لكنها تضيف التعقيد المعماري، كما أن حالات الاستخدام الشائعة لم تظهر بعد.
يعد الضبط الدقيق لنموذج الذكاء الاصطناعي طريقة أخرى يمكنها مساعدة LLM في تقديم استجابات أكثر استهدافًا أو دقة، ويمكن دمجها مع RAG لزيادة تحسين أداء LLM.
هل يمكن استخدام RAG والضبط الدقيق معًا؟
نعم. يقدم هذا النهج الهجين نموذجًا مضبوطًا على بيانات المجال المتخصصة بشكل دقيق، ثم يتم نشره في بنية RAG حتى يتمكن من تقديم أحدث المعلومات أو الأكثر صلة في استجاباته.
ما الفَرق بين RAG ونقل التعلم؟
تُحسِّن RAG من استجابات LLM من خلال الوصول إلى قاعدة معارف محلية مُحدَّثة. يحسِّن نقل التعلم من استجابات نموذج الذكاء الاصطناعي للأغراض العامة من خلال الوصول إلى نموذج الذكاء الاصطناعي المُنفصل الذي تم ضبطه بشكل دقيق للعمل في مجال معين.
