جيفري إريكسون | كاتب أقدم | 21 نوفمبر 2024
أصبحت نماذج اللغات الكبيرة للأغراض العامة، أو نماذج LLM، شائعة لدى الجمهور لأنها يمكن أن تناقش مجموعة واسعة من الموضوعات وتكتب أوراق المصطلحات، شكرًا لك على الملاحظات، والعديد من المهام الأخرى. في مجال الأعمال التجارية، ومع ذلك، فإن هذه النواتج العامة لن تفعل. تحتاج LLM الذي من المتوقع أن يوفر الدعم الفني لأداة معينة، على سبيل المثال، إلى الاعتماد على المعرفة الخاصة بالمجال.
توجد حاليًا طريقتان لمساعدة نماذج الذكاء الاصطناعي التوليدي على تقديم استجابات تعكس هذا النوع من الخبرة: الضبط الدقيق والإنشاء المعزز للاستعادة، أو RAG. ويواجه كل منهما فوائد وتحديات. دعونا نلقي نظرة أعمق على هذه الخيارات لفهم كيفية عملها ومتى تستخدمها.
النقاط الرئيسة
RAG، اختصارًا للإنشاء المعزز للاستعادة، هو إطار معماري طوره باحثون في Meta لمساعدة نماذج الذكاء الاصطناعي للأغراض العامة على تقديم مخرجات ذات صلة ومفيدة للمؤسسات. يقوم RAG بذلك من خلال منح نموذج لغة كبير، أو LLM، إمكانية الوصول إلى قاعدة معارف داخلية يمكنها استخدامها لزيادة بيانات التدريب الأصلية. والنتيجة هي نظام الذكاء الاصطناعي الذي يجمع بين طلاقة اللغة في LLM والبيانات المحلية لتقديم استجابات مستهدفة ومناسبة للسياق. يعمل هذا النهج، على عكس الضبط الدقيق لنموذج الذكاء الاصطناعي، دون تعديل النموذج الأساسي نفسه.
استخدم RAG عندما يكون من المهم لاستجابات الذكاء الاصطناعي العامة توفير بيانات محدثة أو خاصة بالمؤسسة لم تكن جزءًا من تدريب LLM. على سبيل المثال، إذا كانت الشركة لديها مجموعة كبيرة من المعلومات الموثوقة حول منتجاتها أو عملياتها اليومية، فستوفر بنية RAG هذه البيانات لزيادة المطالبات والاستجابات التي تمر عبر LLM، مما يجعل المخرجات أكثر فائدة وقابلية للتحقق ودقة. يمكن أن يؤدي ذلك إلى تحسين أتمتة مكتب المساعدة أو فحوصات توافر المنتجات في البيع بالتجزئة أو حتى الرعاية الصحية حيث يمكن توفير ملاحظات الأطباء بسرعة للمرضى أو الأطباء الآخرين.
تشمل المزايا الشائعة لـ RAG عبر المجالات استرجاع البيانات بشكل أفضل وأكثر اكتمالاً، ودعم العملاء المحسن، والقدرة على إنشاء محتوى مخصص. من خلال تكملة نماذج اللغات الكبيرة بالمعلومات الحالية، يمكن للمؤسسات نشر وكلاء الذكاء الاصطناعي لتوفير إجابات في الوقت الفعلي وذات صلة بالسياق لاستعلامات المستخدم، مما يقلل من الحاجة إلى التدخل البشري. يسمح تعدد استخدامات RAG بالتكيف مع مجموعة واسعة من التطبيقات، بما في ذلك ما يلي:
يعني الضبط الدقيق لنموذج الذكاء الاصطناعي التوليدي أخذ نموذج عام الغرض، مثل Claude 2 من Anthropic أو Command from Cohere أو Llama 2 من Meta؛ مما يمنحه جولات إضافية من التدريب على مجموعة بيانات أصغر خاصة بالمجال؛ وتعديل معلمات النموذج بناءً على هذا التدريب. يساعد هذا الضبط النموذج على الأداء بشكل أفضل في مهام محددة لأنه تم تكييفه مع الفروق الدقيقة والمصطلحات في مجال معين، مثل الترميز أو الرعاية الصحية.
اختر الضبط الدقيق عندما يحتاج LLM إلى أن يكون سريعًا في مجال معين. من خلال التدريب الإضافي، يمكن لـ LLM فهم الموجهات بشكل أفضل وتقديم المخرجات التي تعكس الفروق الدقيقة والمصطلحات في مجال معين. ستحتاج إلى الوصول إلى مجموعة بيانات كبيرة أو مخزن من المستندات التي تم تنسيقها لعملية التدريب، ولكن الضبط الدقيق يستحق الجهد لأنه يسمح بمزيد من التحكم في نمط ونبرة وطريقة المحتوى الذي تم إنشاؤه. يمكن أن يؤتي ثماره في المواد التسويقية أو تفاعلات العملاء. يمكن أن يكون الضبط الدقيق، مثل RAG، مفيدًا أيضًا في الطب والترميز وغيرها من المجالات عالية التخصص.
الضبط الدقيق، عملية تكييف نموذج الذكاء الاصطناعي العام لمهمة أو مجال معين، هو تقنية قوية يمكنها تحسين النتائج بشكل كبير لمجموعة من المؤسسات، خاصة في الحالات التي يكون فيها التخصيص والتخصص أساسيين. فيما يلي بعض حالات الاستخدام الشائعة حيث يمكن أن تكون فعالة بشكل خاص:
يجعل كل من الضبط الدقيق وRAG نماذج LLM للأغراض العامة أكثر فائدة، لكنهما يفعلا ذلك بطرق مختلفة. القياس البسيط هو أن الضبط الدقيق لـ LLM يمنحها فهمًا أعمق لمجال معين، مثل الطب أو التعليم، في حين أن اقتران LLM ببنية RAG يمنحها إمكانية الوصول إلى بيانات محلية محدثة لاستجاباتها.
لماذا لا نستخدمها معًا للحصول على إجابات دقيقة وفي الوقت المناسب؟ إنه اتجاه متزايد وحتى يأتي مع اختصاره الخاص: RAFT، للضبط الدقيق المعزز للاسترجاع. باستخدام هذا النهج المختلط، يتم بعد ذلك نشر نموذج تم ضبطه على بيانات المجال المتخصصة في بنية RAG، حيث يستخدم خبرته في المجال لاستعادة المعلومات الأكثر صلة أثناء إنشاء الاستجابة. والنتيجة هي مخرجات دقيقة للغاية وذات صلة ومراعية للسياق.
سنناقش RAFT بشكل أكبر قليلاً، ولكن دعونا أولاً نحصل على فهم أفضل للنهجين.
يساعد كل من RAG والضبط الدقيق نموذج اللغة الكبيرة على تجاوز الاستجابات العامة المستمدة من مجموعات بيانات التدريب الأصلية المعممة. يتضمن الضبط الدقيق وضع LLM من خلال جولات إضافية من التدريب باستخدام مجموعات البيانات الخاصة بمجال أو مؤسسة معينة.
يغير RAG أيضًا استجابات نماذج اللغة الكبيرة، لكنه لا يغير النموذج الأساسي. بدلاً من ذلك، يستخدم نظام RAG قاعدة بيانات محلية أو مجموعة منسقة من المستندات لإعلام استجابات LLM، غالبًا مع تفاصيل دقيقة.
وقد أدت القيود والفوائد على هذين النهجين، بطبيعة الحال، إلى اتجاه متزايد للجمع بين نقاط قوتهما. والنتيجة هي النهج المختلط المسمى RAFT.
يعود الاختيار بين استخدام بنية RAG أو نظام الضبط الدقيق إلى الموارد التي لديك وكيف ستستخدم LLM. كما هو مذكور في الجدول أدناه، ستستفيد معظم حالات الاستخدام من الجهد المبذول للجمع بين النهجين—بالنسبة لمعظم الشركات، بمجرد بذلها جهدًا للضبط الدقيق، تعد RAG إضافة طبيعية. ولكن فيما يلي ستة أسئلة يجب طرحها لتحديد الأولويات:
| متطلبات حالة الاستخدام | RAG | الضبط الدقيق | RAFT |
|---|---|---|---|
| يجب أن تتضمن الاستجابات معلومات محلية ومحدثة. | نعم |
لا |
نعم |
| يجب أن تتضمن الردود مستوى عالٍ من قابلية التفسير. | نعم |
لا |
نعم |
| يجب أن تعكس الاستجابات المعرفة العميقة بمجال المؤسسة. | نعم |
نعم |
نعم |
| تتمتع المؤسسة بإمكانية الوصول إلى شبكة عصبية قوية وموارد وحدة معالجة الرسومات (GPU) لتدريب الذكاء الاصطناعي. | لا |
نعم |
نعم |
| يجب أن تعكس الردود نغمة المؤسسة ولغة التسويق. | لا |
نعم |
نعم |
| تمتلك المنظمة مجموعة كبيرة ومنظمة تنظيمًا جيدًا ومحدثة من الوثائق لكي يستمد AI من ردودها ويستشهد بها. | نعم |
لا |
نعم |
| يتمتع نظام الذكاء الاصطناعي بإمكانية الوصول إلى موارد وقت تشغيل محدودة. | لا |
نعم |
نعم |
| تمتلك المؤسسة مجموعة بيانات كبيرة ومنسقة ومخزن مستندات لتدريب الذكاء الاصطناعي وضبطه. | نعم |
لا |
نعم |
سواء اخترت RAG أو الضبط الدقيق أو كليهما، تتخصص Oracle في مساعدة مؤسسات مثل مؤسستك على تحقيق مكاسب في الإنتاجية باستخدام الذكاء الاصطناعي التوليدي لـ Oracle Cloud Infrastructure (OCI)، وهي خدمة مُدارة بالكامل تتضمن قوة OCI واختيار نماذج اللغة الكبيرة مفتوحة المصدر أو المملوكة.
نجعل من السهل الجمع بين LLM الخاص بك مع RAG حتى تتمكن من الحصول على استجابات محدثة تستند إلى قواعد معرفتك المتنوعة. عندما يحين الوقت لتشغيل نظام الضبط الدقيق، تعد البنية التحتية لـ Oracle AI خيارًا رائعًا. ستجد مجموعات فائقة تعمل على توسيع ما يصل إلى 65536 وحدة معالجة رسومات—أكثر من كافية لتشغيل أحمال عمل التدريب والاستدلال الأكثر تطلبًا، مثل استجابات LLM ورؤية الكمبيوتر والتحليلات التنبؤية.
تستمر LLMs للأغراض العامة في التحسن، مع تدفق مستمر للإصدارات الجديدة التي تصل من أمثال Anthropic و Cohere و Google و Meta وغيرها الكثير. ولكن بغض النظر عن مدى كفاءة نماذج الذكاء الاصطناعي هذه في التعامل مع اللغة البشرية، فإنها ستحتاج دائمًا إلى طريقة لربط مجموعة المهارات هذه بالاحتياجات المحددة لحالات استخدام الأعمال. الضبط الدقيق وRAG هما حاليًا أفضل طريقتين للقيام بذلك. ابحث عنهم لمواصلة التطور مع تقدم نماذج الذكاء الاصطناعي والأجهزة وبنى البيانات.
يجب أن يلعب مركز امتياز الذكاء الاصطناعي الخاص بك دورًا محوريًا في نشر RAG. ألا تملك CoE؟ إليك طريقة الحصول على واحد وتشغيله الآن.
هل RAG أفضل من الضبط الدقيق؟
يختلف الضبط الدقيق لنموذج RAG والذكاء الاصطناعي، مع فوائدهما وتكاليفهما الخاصة. كلاهما من الطرق الشائعة لجعل نماذج الذكاء الاصطناعي التوليدي أكثر فائدة، ويجب على كل مؤسسة اختيار الطريقة التي تناسب احتياجاتها بشكل أفضل. هناك خيار شائع آخر هو الجمع بين النهجين، اللذين يطلق عليهما RAFT، من أجل الضبط الدقيق المعزز للاسترجاع.
ما هو أفضل من RAG؟
RAG هي ببساطة تقنية لمساعدة LLM على تقديم استجابات أفضل من خلال الإشارة إلى بيانات الشركة ومستنداتها. ظهرت طريقة تسمى GraphRAG كوسيلة لزيادة تحسين استجابات LLM بما يتجاوز ما يمكن أن تفعله بنية RAG بمفردها، لكنها تضيف التعقيد المعماري وحالات الاستخدام الشائعة لم تظهر بعد.
يعد الضبط الدقيق لنموذج الذكاء الاصطناعي طريقة أخرى يمكنها مساعدة LLM على تقديم استجابات أكثر استهدافًا أو دقة، ويمكن دمجها مع RAG لزيادة تحسين أداء LLM.
هل يمكن استخدام RAG والضبط الدقيق معًا؟
نعم. يقدم هذا النهج المختلط نموذجًا مضبوطًا على بيانات المجال المتخصصة، ثم يتم نشره في بنية RAG حتى يتمكن من تقديم أحدث المعلومات أو الأكثر صلة في استجاباته.
ما الفرق بين RAG ونقل التعلم؟
تعمل RAG على تحسين استجابات LLM من خلال الوصول إلى قاعدة معارف محلية محدثة. يحسن نقل التعلم من استجابات نموذج الذكاء الاصطناعي للأغراض العامة من خلال الوصول إلى نموذج الذكاء الاصطناعي المنفصل الذي تم ضبطه للعمل في مجال معين.
