RAG مقابل الضبط الدقيق: طريقة الاختيار

جيفري إريكسون | كاتب أول | 21 نوفمبر 2024

أصبحت نماذج اللغات الكبيرة للأغراض العامة، أو نماذج LLM شائعة لدى الجمهور لأنها يمكن أن تناقش مجموعة واسعة من الموضوعات وتكتب أوراق بحثية، وبطاقات شُكر، والعديد من المهام الأخرى. مع ذلك، لن تكون كذلك في مجال الأعمال التجارية هذه النواتج العامة. يحتاج LLM الذي من المتوقع أن يوفر الدعم الفني لأداة معينة، على سبيل المثال إلى الاعتماد على المعرفة الخاصة بالمجال.

توجد حاليًا طريقتان لمساعدة نماذج الذكاء الاصطناعي التوليدي في تقديم استجابات تعكس هذا النوع من الخبرة: الضبط الدقيق والتوليد المعزز بالاسترجاع أو RAG. يصحب كل منهما مزايا وتحديات. دعونا نلقي نظرة أعمق على هذه الخيارات لفهم طريقة عملها ومتى تستخدمها.

النقاط الرئيسة

  • يجعل كل من RAG والضبط الدقيق نماذج الذكاء الاصطناعي العامة أفيد في حقل محدد أو لحالة استخدام محددة.
  • يقوم RAG بمنح LLM وصولاً إلى مخازن البيانات الداخلية للشركة؛ مما يساعد LLM في توفير استجابات أكثر استهدافًا، وهو أمر بالغ الأهمية لحالات الاستخدام التي تعتمد على معلومات محدثة.
  • تشمل الاستخدامات الشائعة لـ RAG الدعم الفني والبحث في المخزون وتوصيات البيع بالتجزئة.
  • يستخدم الضبط الدقيق مجموعة من البيانات الخاصة بالمجال لتدريب LLM للأغراض العامة على مهمة معينة. فكِّر في الطب أو البرمجة، والذي لهما منطقهما و لغتهما الخاصة.
  • يمكن الجمع بين الضبط الدقيق وRAG لمنح LLM معرفة قوية بالمجال ومعلومات مُحدّثة.

ما المقصود بالإنشاء المعزز للاستعادة (RAG)؟

إن RAG اختصارًا للتوليد المعزز بالاسترجاع، هو إطار معماري طوره باحثون في Meta لمساعدة نماذج الذكاء الاصطناعي للأغراض العامة في تقديم مخرجات ذات صلة ومُفيدة للمؤسسات. تقوم RAG بذلك من خلال منح نموذج لغة كبير، أو LLM، إمكانية الوصول إلى قاعدة معارف داخلية يمكن استخدامها لزيادة بيانات التدريب الأصلية. تكون النتيجة في نظام الذكاء الاصطناعي الذي يجمع بين الطلاقة اللغوية في LLM والبيانات المحلية لتقديم استجابات مستهدفة ومناسبة للسياق. يعمل هذا النهج على عكس الضبط الدقيق لنموذج الذكاء الاصطناعي، دون تعديل النموذج الأساس نفسه.

وقت استخدام RAG

استخدم RAG عندما يكون من المهم لاستجابات الذكاء الاصطناعي العامة توفير بيانات مُحدَّثة أو خاصة بالمؤسسة لم تكن جزءًا من تدريب LLM. على سبيل المثال، إذا كانت الشركة لديها مجموعة كبيرة من المعلومات الموثوقة حول منتجاتها أو عملياتها اليومية، فتوفر بنية RAG هذه البيانات لتعزيز المطالبات والاستجابات التي تمر عبر LLM، مما يجعل المخرجات أفيد وقابلة للتحقق ودقيقة. يمكن أن يؤدي ذلك إلى تحسين أتمتة مكتب الخدمة أو فحوصات توافر المنتجات في البيع بالتجزئة أو حتى الرعاية الصحية، إذ يمكن أن تتوفر ملاحظات الأطباء بسرعة للمرضى أو الأطباء الآخرين.

حالات استخدام RAG

تشمل المزايا الشائعة لـ RAG عبر المجالات استرجاع البيانات بشكل أفضل وأكمل، ودعم العملاء المحسن، والقدرة على إنشاء محتوى مُخصص. من خلال استكمال نماذج اللغات الكبيرة بالمعلومات الحالية، يمكن للمؤسسات نشر وكلاء الذكاء الاصطناعي لتوفير إجابات فورية وذات صلة بالسياق لاستعلامات المستخدم، مما يقلل من الحاجة إلى التدخل البشري. يسمح تنوع استخدامات RAG بأن يتكيف مع مجموعة واسعة من التطبيقات، بما في ذلك ما يلي:

  • التحليل الذكي للأعمال. يمكن للشركات استخدام RAG لمساعدة نماذج GenAI في سحب بيانات السوق ذات الصلة للإنتاج الآلي للرؤى والتقارير. يمكن أن تتضمن هذه البيانات البحث السوقي وتحليل المنافسين وحجم المبيعات وملاحظات العملاء.
  • توصيات المحتوى. يمكن أن يُحسِّن RAG من أنظمة التوصية بالمحتوى، والتي تتزامن غالبًا مع قواعد بيانات المتجهات. يتيح RAG لنموذج الذكاء الاصطناعي استرجاع وتحليل مراجعات المستخدم وتقييماته وأوصاف المحتوى التي تسمح للنظام بإنشاء توصيات مُخصصة تتوافق مع مطالبة المستخدم.
  • تدقيق الحقائق في الصحافة ووسائل الإعلام الأخرى. يمكن لـ RAG مساعدة المؤسسات في استرداد المستندات وإحالتها مرجعيًا بسرعة والتحقق من المطالبات المُقدمة في المقالات أو التقارير أو الوسائط الاجتماعية.
  • التشخيص الطبي. في مجال الرعاية الصحية، يمكن تطبيق RAG لدعم الأطباء والمعالجين الآخرين من خلال المساعدة في تشخيص العلاج والتخطيط له. يقوم بذلك من خلال مساعدة نماذج الذكاء الاصطناعي على استرداد دراسات الحالة الطبية أو الأوراق البحثية أو نتائج التجارب السريرية ذات الصلة بأعراض المريض أو حالته.
  • الدعم الفني. يمكن استخدام RAG للمساعدة في تقليل وقت الحلول وتحسين رضا المستخدم في الدعم الفني. قد يسترد النظام أدلة ووثائق استكشاف الأخطاء وإصلاحها ذات الصلة أو حتى يمسح سلاسل المحادثات وتوفيرها إلى LLM للمساعدة في حل مشكلات المستخدم. بالإضافة إلى ذلك، يمكن أن يشير RAG إلى قاعدة بيانات تحتوي على سجلات من التفاعلات الحديثة للعميل للحصول على خدمة شخصية وأكثر تخصيصًا.

ما المقصود بالضبط الدقيق؟

يعني الضبط الدقيق لنموذج الذكاء الاصطناعي التوليدي تناول نموذج للأغراض العامة، مثل Claude 2 من Anthropic أو Command from Cohere أو Llama 2 من Meta؛ مع منحه جولات إضافية من التدريب على مجموعة بيانات أصغر خاصة بالمجال؛ وضبط معلمات النموذج بناءً على هذا التدريب. يساعد هذا الضبط النموذج في الأداء بشكل أفضل في مهام مُحددة لأنه تم تكييفه مع الفروق الدقيقة والمصطلحات في مجال معين، مثل الترميز أ الصو الرعايةحية.

وقت استخدام الضبط الدقيق

اختر الضبط الدقيق عندما يحتاج نموذج LLM إلى أن يكون مُبدعًا في مجال معين. من خلال التدريب الإضافي، يمكن لـ LLM فهم المطالبات بشكل أفضل وتقديم المخرجات التي تعكس الفروق الدقيقة والمصطلحات في مجال معين. تحتاج إلى الوصول إلى مجموعة بيانات كبيرة أو مخزن من المستندات التي تم تنسيقها لعملية التدريب، لكن يستحق الضبط الدقيق الجهد لأنه يسمح بمزيد من التحكم في نمط المحتوى الذي تم إنشاؤه ونغمته وطريقته. يمكن أن يؤتي ثماره في المواد التسويقية أو تفاعلات العملاء. يمكن أن يكون الضبط الدقيق، مثل RAG مفيدًا أيضًا في الطب والترميز وغيرها من المجالات عالية التخصص.

حالات استخدام الضبط الدقيق

إن الضبط الدقيق عملية تكييف نموذج الذكاء الاصطناعي العام لمهمة أو مجال معين، وهي تقنية قوية يمكنها تحسين النتائج بشكل كبير لمجموعة من المؤسسات، خاصةً في الحالات التي يكون فيها التخصيص والتخصص أساسيين. فيما يلي بعض حالات الاستخدام الشائعة التي يمكن أن يكون فيها فعالاً بشكل خاص:

  • أتمتة دعم العملاء. يمكن أن يساعد الضبط الدقيق لـ LLM باستخدام مجموعة كبيرة ومُنسقة جيدًا من البيانات والمستندات حول منتجات شركتك وخدماتها وعملياتها نموذج اللغة الكبيرة على أن يكون نظامًا مؤتمتًا لدعم العملاء أكثر فائدة. يفهم نموذج LLM المنضبط بشكل دقيق بشكل أفضل المفردات والفروق الدقيقة في تفاعلات العملاء ويصبح قادرًا على الاستجابة بشكل مناسب.
  • المحتوى التعليمي. يمكن ضبط نماذج LLM على المواد التعليمية في مجال معين، مثل التاريخ أو القواعد النحوية. يمكن لنموذج LLM بعد ذلك المساعدة في إنشاء محتوى تعليمي جديد، وتلخيص الكتب المدرسية، وإنشاء أسئلة الاختبارات، حتى توفير حصص تعليمية في مختلف المجالات.
  • معالجة المعلومات الطبية. يمكن ضبط نماذج LLM بدقة باستخدام المنشورات الطبية وسجلات المرضى المجهولة الهوية والنصوص والصور الطبية الأخرى، مما يجعلها أفيد لاقتراح العلاجات والتشخيصات.

التوليد المعزز بالاسترجاع (RAG) مقابل الضبط الدقيق: الفروق الرئيسة

يجعل كل من الضبط الدقيق وRAG نماذج LLM للأغراض العامة أفيد، لكنها تفعل ذلك بطرق مُختلفة. يأتي تشبيه بسيط في أن الضبط الدقيق لـ LLM يمنحه فهمًا أعمق لمجال معين، مثل الطب أو التعليم، في حين أن اقتران LLM ببنية RAG يمنحه إمكانية الوصول إلى بيانات محلية مُحدَّثة حول استجاباتها.

لماذا لا نستخدمهما معًا للحصول على إجابات دقيقة وفي الوقت المناسب؟ إنه اتجاه متنامي وحتى يأتي مع اختصاره الخاص: RAFT، للضبط الدقيق المعزز بالاسترجاع. باستخدام هذا النهج الهجين، يتم بعد ذلك نشر نموذج تم ضبطه على بيانات المجال المُتخصصة في بنية RAG، إذ تستخدم خبرتها في المجال لاسترداد المعلومات الأكثر صلة أثناء إنشاء الاستجابة. تكون النتيجة في مخرجات دقيقة للغاية وذات صلة ومراعية للسياق.

نناقش RAFT بشكل أكبر قليلاً، لكن دعونا أولاً نصل إلى فهم أفضل للنهجين.

الضبط الدقيق

يساعد كل من RAG والضبط الدقيق نموذج اللغة الكبيرة في تجاوز الاستجابات العامة المستمدة من مجموعات بيانات التدريب الأصلية المُعممة. يشمل الضبط الدقيق وضع نموذج LLM عبر جولات إضافية من التدريب باستخدام مجموعات البيانات الخاصة بمجال أو مؤسسة معينة.

  • المتطلبات
    التي تتطلب من فِرق تكنولوجيا المعلومات والأعمال أن نضع مُسبقًا العمل لجمع مجموعات البيانات الكبيرة وتنقيحها وتصنيفها لهذه الجولات الجديدة من التدريب. إن نظام التدريب نفسه كثيف الحوسبة، ويتطلب بنية ذكاء اصطناعي مُتقدمة من الشبكات العصبية المدعومة بوحدات معالجة رسومات كافية لتدريب نموذج LLM في فترة زمنية معقولة.
  • الناتج
    تكون النتيجة في نموذج LLM الذي يبدع في المعلومات وبلغة مجال معين أو حالة عمل معينة.
  • السلبيات المحتملة
    على عكس نظام RAG، يعتمد نموذج LLM بالكامل على مجموعة البيانات المستخدمة لنظام التدريب الضبط الدقيق ويفتقر إلى الوصول إلى المعرفة الخارجية المُحدثة. يمكن أن يفقد نموذج LLM المضبوط بشكل دقيق أيضًا، أو "ينسى"، بعض النقاط الدقيقة في تدريبه الأصلي. على سبيل المثال، قد يفقد الدقة في المحادثة العامة لأنه يصبح منغمسًا في تخصص معين، مثل الطب. ربما كنت تعرف الأطباء الذين يعانون من نفس المصير.

RAG

يغير RAG أيضًا استجابات نماذج LLM، لكنه لا يغير النموذج الأساس. بدلاً من ذلك، يستخدم نظام RAG قاعدة بيانات محلية أو مجموعة مُنسقة من المستندات للإبلاغ عن استجابات LLM، وغالبًا مع تفاصيل حتى آخر لحظة.

  • النقاط الإيجابية
    تُعتبر بنية RAG متفوقة على الضبط الدقيق من جانب أمان البيانات والخصوصية لأنه يمكن تخزين البيانات في بيئة آمنة مع ضوابط وصول صارمة، مما يساعد في ضمان عدم انعكاس البيانات الخاصة في استجابات الذكاء الاصطناعي.
  • النقاط السلبية
    تظهر نقطة سلبية في هذا النهج مقارنة بالضبط الدقيق في عدم تدريب نماذج اللغة على الدقة في أي مجال معين؛ إذ تعمل بُناءً على المعرفة العامة بتدريب LLM.

مقارنة مجموعات المهارات والتكاليف

  • مجموعات المهارات
    فيما يتعلق بمجموعات المهارات، في حين أن RAG أبسط في التنفيذ، يتطلب RAG والضبط الدقيق خبرة مُتداخلة في الترميز وإدارة البيانات. بالإضافة إلى ذلك، يحتاج الفريق المشارك في الضبط الدقيق إلى مزيد من الخبرة في معالجة اللغة الطبيعية (NLP) والتعلم العميق وتكوين النماذج.
  • الوقت والتكلفة
    يتطلب الضبط الدقيق المزيد من العمل المُسبق بينما يتطلب RAG المزيد من الموارد في وقت التشغيل. يعني الضبط الدقيق جولات من التدريب المُكثف للحوسبة قبل نشر نموذج اللغة الكبيرة، مما يجعله مشروعًا أكثر تكلفة مقابل بنية RAG. بمجرد إدخال LLM مضبوطًا بشكل دقيق في الخدمة، تكون بنية وقت التشغيل مع ذلك واضحة إلى حد ما. عند هذه النقطة، يضيف نظام RAG طبقة إضافية من التعقيد إلى LLM، مما يتطلب من الفريق الحفاظ على قاعدة بيانات مُحدثة وموارد حسابية إضافية لكل مطالبة.

النهج الهجين: RAFT

أدت القيود—والمزاي—من هذين النهجين بطبيعة الحال، إلى اتجاه متنامي للجمع بين نقاط قوتهما. كانت النتيجة في النهج الهجين المسمى RAFT.

طريقة الاختيار بين RAG والضبط الدقيق

يعود الاختيار بين استخدام بنية RAG أو نظام الضبط الدقيق إلى الموارد التي لديك وكيف تستخدم نموذج LLM. كما هو مذكور في الجدول أدناه، تستفيد معظم حالات الاستخدام من الجهد المبذول للجمع بين النهجين—بالنسبة إلى معظم الشركات، بمجرد بذلها جهدًا للضبط الدقيق، يصبح RAG إضافة طبيعية. لكن فيما يلي ستة أسئلة يجب طرحها لتحديد الأولويات:

  1. هل يجب أن تتضمن الاستجابات بيانات محلية وحديثة للغاية؟ يعد تعريف استجابات LLM ببياناتك المُحدثة الخاصة نقطة إيجابية لـ RAG ولماذا اكتسبت شعبية بسرعة.
  2. هل يعمل LLM في صناعة مُتخصصة؟ يسمح الضبط الدقيق لـ LLM بتفسير المطالبات بشكل أفضل وتقديم الاستجابات باللغة الفريدة لمهمة معينة أو مجال عمليات معين، مثل الرعاية الصحية.
  3. هل خصوصية البيانات وأمانها أمر بالغ الأهمية؟ تتيح بنية RAG للمؤسسة الاحتفاظ بالبيانات الحساسة في قاعدة بيانات محلية وآمنة بشكل جيد.
  4. هل نبرة الاستجابات وطريقتها مهمة؟ يتيح الضبط الدقيق لـ LLM تقديم استجابات باللغة المُتخصصة التي تفضلها مؤسسة أو حقل معين. إذا كان العملاء أو عملاء البيع بالتجزئة أو الشركاء يستعلمون عن LLM، فإن الضبط الدقيق يضيف نغمة احترافية.
  5. هل موارد وقت التشغيل محدودة؟ لا يتطلب نموذج LLM المضبوط بشكل دقيق موارد وقت تشغيل أكثر من LLM للأغراض العامة. يكون RAG أكثر تعقيدًا، مما يتطلب من LLM الاستعلام عن قواعد البيانات المحلية لتعزيز الاستجابات. يضيف ذلك تكلفة إضافية.
  6. هل توجد إمكانية الوصول إلى البنية التحتية للحوسبة ومجموعات مهارات الذكاء الاصطناعي؟ يتطلب الضبط الدقيق ونموذج LLM كلاهما. يحتاج RAG إلى موارد وقت التشغيل والبنية التحتية للبيانات، لكن مع مهارات ذكاء اصطناعي أقل.
متطلبات حالة الاستخدام RAG الموالفة الجيدة RAFT
يجب أن تتضمن الاستجابات معلومات محلية ومُحدثة.
نعم
لا
نعم
يجب أن تتضمن الاستجابات مستوى عالٍ من قابلية التفسير.
نعم
لا
نعم
يجب أن تعكس الاستجابات المعرفة العميقة بمجال المؤسسة.
نعم
نعم
نعم
تتمتع المؤسسة بإمكانية الوصول إلى شبكة عصبية قوية وموارد وحدة معالجة الرسومات (GPU) لتدريب الذكاء الاصطناعي.
لا
نعم
نعم
يجب أن تعكس الاستجابات نبرة المؤسسة ولغة التسويق.
لا
نعم
نعم
تمتلك المؤسسة مجموعة كبيرة ومُنظمة تنظيمًا جيدًا ومُحدثة من الوثائق لكي يستمد منها الذكاء الاصطناعي ويستشهد بها في استجابته.
نعم
لا
نعم
يتمتع نظام الذكاء الاصطناعي بإمكانية الوصول إلى موارد وقت تشغيل محدودة.
لا
نعم
نعم
تمتلك المؤسسة مجموعة بيانات كبيرة ومُنسقة ومخزن مستندات لتدريب الذكاء الاصطناعي وضبطه بشكل دقيق.
نعم
لا
نعم

احصل على قيمة أعمال أكبر من GenAI باستخدام البنية التحتية من Oracle Cloud

سواء اخترت RAG أو الضبط الدقيق أو كليهما، تتخصص Oracle في مساعدة مؤسسات مثل مؤسستك في تحقيق مكاسب في الإنتاجية باستخدام الذكاء الاصطناعي التوليدي للبنية التحتية من Oracle Cloud (OCI)، وهي خدمة مُدارة بالكامل تتضمن قوة OCI واختيار نماذج LLM مفتوحة المصدر أو المملوكة.

نسهِّل الجمع بين LLM لديك مع RAG حتى تتمكن من الحصول على استجابات مُحدَّثة تستند إلى قواعد المعارف المتنوعة لديك. عندما يحين الوقت لتشغيل نظام الضبط الدقيق، تكون البنية التحتية لـ Oracle AI خيارًا رائعًا. تجد مجموعات فائقة تتوسَّع إلى ما يصل إلى 65536 وحدة GPU—أكثر من كافية لتشغيل أحمال عمل التدريب والاستدلال الأكثر تطلبًا، مثل استجابات LLM ورؤية الكمبيوتر والتحليلات التنبؤية.

تستمر نماذج LLM للأغراض العامة في التحسن، مع تدفق مستمر للإصدارات الجديدة التي تصل من أمثال Anthropic وCohere وGoogle وMeta وغيرها الكثير. لكن بغض النظر عن مدى كفاءة نماذج الذكاء الاصطناعي هذه في التعامل مع اللغة البشرية، فإنها تحتاج دائمًا إلى طريقة لربط مجموعة المهارات هذه بالاحتياجات المحددة لحالات استخدام الأعمال. يُعد الضبط الدقيق وRAG حاليًا أفضل طريقتين للقيام بذلك. ابحث عنهم لمتابعة التطور مع تقدم نماذج الذكاء الاصطناعي والأجهزة وبُنى البيانات.

يجب أن يلعب مركز امتياز الذكاء الاصطناعي لديك دورًا محوريًا في نشر RAG. ألا تملك CoE؟ إليك طريقة الحصول على واحد وتشغيله الآن.

الأسئلة الشائعة حول الضبط الدقيق مقابل RAG

هل RAG أفضل من الضبط الدقيق؟

يختلف الضبط الدقيق لنموذج الذكاء الاصطناعي وRAG، مع مزاياهما وتكاليفهما الخاصة. كلاهما من الطرق الشائعة لجعل نماذج الذكاء الاصطناعي التوليدي أفيد، ويجب على كل مؤسسة اختيار الطريقة التي تناسب احتياجاتها بشكل أفضل. يوجد خيار شائع آخر هو الجمع بين النهجين، اللذين يطلق عليهما RAFT، من أجل الضبط الدقيق المعزز بالاسترجاع.

ما الأفضل من RAG؟

يُعد RAG ببساطة تقنية لمساعدة LLM في تقديم استجابات أفضل من خلال الإشارة إلى بيانات الشركة ومستنداتها. ظهرت طريقة تُسمى GraphRAG باعتبارها وسيلة لزيادة تحسين استجابات LLM بما يتجاوز ما يمكن أن تفعله بنية RAG بمفردها، لكنها تضيف التعقيد المعماري، كما أن حالات الاستخدام الشائعة لم تظهر بعد.

يعد الضبط الدقيق لنموذج الذكاء الاصطناعي طريقة أخرى يمكنها مساعدة LLM في تقديم استجابات أكثر استهدافًا أو دقة، ويمكن دمجها مع RAG لزيادة تحسين أداء LLM.

هل يمكن استخدام RAG والضبط الدقيق معًا؟

نعم. يقدم هذا النهج الهجين نموذجًا مضبوطًا على بيانات المجال المتخصصة بشكل دقيق، ثم يتم نشره في بنية RAG حتى يتمكن من تقديم أحدث المعلومات أو الأكثر صلة في استجاباته.

ما الفَرق بين RAG ونقل التعلم؟

تُحسِّن RAG من استجابات LLM من خلال الوصول إلى قاعدة معارف محلية مُحدَّثة. يحسِّن نقل التعلم من استجابات نموذج الذكاء الاصطناعي للأغراض العامة من خلال الوصول إلى نموذج الذكاء الاصطناعي المُنفصل الذي تم ضبطه بشكل دقيق للعمل في مجال معين.