جيفري إريكسون | كاتب أقدم | 25 فبراير 2025
نظرًا إلى أن الذكاء الاصطناعي يصبح أكثر فائدة للشركات ويتولى وكلاء الذكاء الاصطناعي على وجه الخصوص مهام سير عمل أكثر تعقيدًا، كما أن ضبط الذكاء الاصطناعي سيكون جزءًا هامًا من القصة. يمكن لهؤلاء الوكلاء الإجابة عن الأسئلة المتعلقة بالبيانات واتخاذ الإجراءات نيابة عنا - كتابة التعليمات البرمجية وإدارة التقويمات وتقديم الرؤى التحليلية وغير ذلك الكثير. على طول الطريق، يتعين على نماذج الذكاء الاصطناعي العمل معًا للتحقيق في مخازن البيانات والمستندات، وجمع المعلومات، والتحقق من دقتها، وتشغيل الإجراءات الصحيحة، والتواصل معها. تكون نماذج الذكاء الاصطناعي المتطورة المعنية على دراية جيدة بالأنماط العامة للغة، لكنها تحتاج أيضًا إلى التحسين لمجالات محددة باستخدام لغة خاصة بها وقاعدة معارفها والمزيد. كيف يمكن لعملية الضبط الدقيقة مساعدة نموذج الذكاء الاصطناعي، ووكلاء الذكاء الاصطناعي المستقبليين، في الحصول على الفروق الدقيقة والتفاصيل الصحيحة؟ نستكشف جوانب الضبط الدقيق لنموذج الذكاء الاصطناعي أدناه.
الضبط الدقيق لنموذج الذكاء الاصطناعي هو العملية التي يستخدمها علماء البيانات ومهندسو التعلم الآلي (ML) لتكييف نموذج تعلم آلي مدرب لأداء أفضل في مهمة محددة. على سبيل المثال، يمكن استخدام الضبط الدقيق لاتخاذ نموذج لغة كبير للأغراض العامة (LLM)، مثل أمر Cohere أو Llama 2 من Meta، وجعله أكثر ارتباطًا في بيئة الرعاية الصحية أو دور خدمة العملاء.
يتم تدريب هذه النماذج ذات الأغراض العامة، والتي تسمى أحيانًا "نماذج الأساس"، على مجموعات البيانات العامة الكبيرة—مثل البيانات من الإنترنت المفتوح بالكامل تقريبًا. وهذا يساعدهم على تعلم وفهم مجموعة واسعة من الميزات والأنماط. فبعضها يتعامل بشكل جيد مع اللغة، والبعض الآخر يمكنه التعرف على البيانات متعددة الوسائط ومعالجتها، مثل الصور والفيديو والصوت والنص.
يأخذ الضبط الدقيق هذا النموذج المتطور ويواصل تدريبه على مجموعة بيانات أصغر مستمدة من مهمة أو مجال عمل معين. وهذا يعطي النموذج فهمًا للتصنيف والسياق وحتى المعرفة المتخصصة في هذا المجال.
تتمثل الفكرة في الحفاظ على المعرفة الواسعة من نظام التدريب الأصلي للنموذج مع منحه فهمًا أفضل للفروق الدقيقة والتفاصيل في المجال الذي سيعمل فيه نموذج الذكاء الاصطناعي. على سبيل المثال، يمكن ضبط نموذج الذكاء الاصطناعي للأغراض العامة لقراءة التصوير الطبي ومناقشته، أو يمكن ضبط روبوت محادثة قائم على LLM أصبح أكثر طلاقة في اللهجات المحلية لتحسين دوره في خدمة العملاء. يعتمد السباق لبناء وكلاء الذكاء الاصطناعي ذوي القدرات العالية في مجموعة واسعة من المجالات غالبًا على النماذج مضبوطة بشكل دقيق. فيما يلي مناقشة أعمق لأساليب الضبط الدقيق وآلياته.
النقاط الرئيسة
تتمثل إحدى فرق التحدي الرئيسة التي تواجهها عند إجراء الضبط الدقيق للذكاء الاصطناعي في توافر بيانات عالية الجودة ومصنفة ذات صلة بحالات استخدامها—قد يكون الحصول على هذه البيانات أو إنشاؤها مكلفًا ويستغرق وقتًا طويلاً. على سبيل المثال، يمكن أن تعني بيانات التسمية ساعات من ملاحظة المناطق في الصور التي يجب أن يتعلم الذكاء الاصطناعي التعرف عليها، أو تسمية أقسام من النص لتمييز المعلومات الرئيسية. ومع ذلك، يوفر الضبط الدقيق مزايا جذابة تجعله تقنية بالغة الأهمية في تطوير الذكاء الاصطناعي الحديث. دعونا ننظر إلى بعض الإيجابيات والسلبيات.
يعمل ضبط الذكاء الاصطناعي باستخدام النماذج الحالية كنقاط بداية. تتوفر نماذج الأساس هذه، مثل Llama 2 من Meta أو أمر Cohere، عادةً من موفري السحابة. ستقدم العديد من المؤسسات نماذج أخرى إلى منصات علوم البيانات الخاصة بها من المستودعات المركزية، مثل Hugging Face وTensorFlow Hub وPyTorch Hub، التي تستضيف نماذج التعلم الآلي المدربة مسبقًا.
البدء بنموذج تم تدريبه مسبقًا
اختر نموذجًا مناسبًا تمامًا لمهمتك، سواء كان ذلك تصنيف النص، أو تحليل المشاعر، أو الإجابة على الأسئلة، أو كتابة المقالات، أو إنشاء التعليمات البرمجية، أو اكتشاف الكائنات، أو أي وظيفة أخرى تتطلب الذكاء الاصطناعي أو التعلم الآلي.
يتطلب الضبط الدقيق لنموذج الذكاء الاصطناعي ثلاثة مكونات أساس: مجموعة من البيانات المنسقة بشكل صحيح، ونموذج الأساس الصحيح، والبنية التحتية التي توفر الشبكات العصبية للتعلم العميق ووحدات معالجة الرسومات (GPU) لتشغيل نظام التدريب. غالبًا ما يتم تجميع هذه الموارد في منصة لعلوم البيانات أو، مؤخرًا في خدمة سحابية للذكاء الاصطناعي التوليدي.
كما يحدث غالبًا مع التكنولوجيا، أصبحت عملية الضبط الدقيق للذكاء الاصطناعي أسهل بمرور الوقت، بفضل الأدوات الجديدة وخدمات البنية التحتية من المشروعات مفتوحة المصدر وفرق تطوير موفري السحابة. تساعد هذه الأدوات والخدمات على أتمتة الضبط الدقيق—بما في ذلك المهام المعقدة التي سنناقشها، مثل تحسين المعاملات الفائقة واختيار النماذج والمعالجة المسبقة للبيانات. وهذا يجعل العملية أكثر سهولة لغير الخبراء.
في الواقع، لاحظ مراقبو الصناعة أن الأدوات أصبحت جيدة جدًا في تجريد علوم البيانات من الضبط الدقيق لدرجة أن الجزء الأصعب هو الآن جمع وتنسيق أفضل مجموعة بيانات ممكنة. هنا أيضًا، توجد مكتبات للبيانات الجاهزة لمختلف المجالات، مثل الرعاية الصحية والتمويل والإمكانات، مثل رؤية الكمبيوتر أو تحليل المشاعر أو الكشف عن أوجه الخلل. في الواقع، الاتجاه المتزايد هو استخدام نموذج لحالة الاستخدام الخاصة بك التي تم ضبطها بالفعل بطريقة دقيقة لهذه المهمة باستخدام هذه المكتبات. من تلك النقطة، قد تضبط المؤسسة بشكل أكبر باستخدام مجموعة بيانات أصغر، وربما تستخدم بنية الإنشاء المعزز للاستعادة، أو RAG، لزيادة تحسين مخرجات الذكاء الاصطناعي.
وجدت الشركات طرقًا لتكملة أساليب الضبط التقليدية باستخدام تقنية تسمى التعلم المعزز. يسمح هذا لنماذج الذكاء الاصطناعي بالتعلم من خلال التجربة والخطأ والتحسين الذاتي بدلاً من استخدام عملية منفصلة من وضع العلامات على مجموعة البيانات والضبط الدقيق الخاضع للإشراف.
طريقة ضبط نموذج الذكاء الاصطناعي بدقة في أربع خطوات
1. استخدم نموذجًا تم تدريبه مسبقًا: تتمثل الخطوة الأولى في تحديد نموذج أساس مناسب للمهمة. هناك نماذج شائعة لمعالجة اللغة الطبيعية، ورؤية الكمبيوتر، وتوليد النص، وغيرها من المجالات.
2. إضافة بيانات جديدة: بعد ذلك، جمع مجموعة بيانات خاصة بالمهمة وإعدادها. قد تتكون هذه من مراجعات العملاء المصنفة أو عينة من الأسئلة والإجابات في المجال الذي يهدف نموذجك إلى معالجته.
3. التعديل: الخطوة الثالثة هي تعديل النموذج حسب الحاجة. قد تتضمن التعديلات تجميد الطبقات للحفاظ على التعلم السابق للنموذج؛ وتعديل معدل التعلم، والذي يمكن أن يساعد أيضًا في الحفاظ على المعرفة الحالية للنموذج؛ وإضافة طبقات يتم فيها تعلم مهام جديدة تمامًا، مثل طبقة تصنيف لتصنيف النص أو طبقة انحدار للتنبؤات.
4. تدريب النموذج: تتضمن هذه العملية تغذية البيانات الجديدة من خلال النموذج وتحديث معلمات النموذج. الهدف هو تحسين أداء النموذج لمهمتك مع الحفاظ على المعرفة العامة من تدريبها الأولي.
عند ضبط نموذج، هناك مجموعة من التقنيات المتاحة للاختيار من بينها. القرار الأول هو ما إذا كنت بحاجة إلى ضبط دقيق كامل أو انتقائي.
الضبط الدقيق الكامل هو عملية يتم فيها تحديث جميع طبقات ومعلمات النموذج التأسيسي أثناء عملية التدريب. هذا خيار جيد عندما يكون لديك مجموعة بيانات كبيرة ومتنوعة يمكنها تحديث معلمات النموذج بشكل كاف دون خطر التجهيز الزائد.
يتضمن الضبط الدقيق الانتقائي تحديث مجموعة فرعية من طبقات النموذج أو معلماته فحسب باستخدام مجموعة بيانات أصغر. هذه الطريقة جيدة للحفاظ على المعرفة العامة لنموذج الأساس وخفض الوقت وتكلفة حساب نظام التدريب. فيما يلي أمثلة على تقنيات الضبط الدقيق الانتقائي.
في بعض حالات الاستخدام، من المنطقي تصميم نموذج الذكاء الاصطناعي وتدريبه من البداية. ومع ذلك، في معظم الحالات، يمكن للمؤسسة الحصول على النتيجة المرجوة من خلال ضبط نموذج الأساس.
يمكن أن يكون تدريب نموذج الذكاء الاصطناعي من البداية الخيار الأفضل في بعض الحالات. أحد الأمثلة على ذلك هو عندما يكون المجال الذي تعمل فيه دقيقًا للغاية، مثل تطبيق طبي متخصص مع بيانات صورة محددة جدًا. يتطلب التدريب من البداية تجميع مجموعة بيانات كبيرة وتشغيل جولات طويلة من التدريب على البنية التحتية الخاصة بالذكاء الاصطناعي. قد يكون هذا مكلفًا، مما يتطلب ما يصل إلى آلاف وحدات معالجة الرسومات (GPU) وملايين الدولارات. كما أنها مهمة تحتاج إلى خبرة علماء البيانات ومهندسي التعلم الآلي.
من ناحية أخرى، يتضمن الضبط الدقيق لنموذج الذكاء الاصطناعي أخذ نموذج أساس وتكييفه مع مهمة محددة باستخدام مجموعة بيانات أصغر خاصة بالمهمة. غالبًا ما تكون هذه العملية أسرع وأكثر كفاءة لأن النموذج يبدأ بأساس قوي في اللغة والمعرفة العامة ويحتاج فقط إلى التكيف مع الفروق الدقيقة في المهمة الجديدة. يمكن أن يؤدي هذا إلى تحسين أداء نموذج الذكاء الاصطناعي لتلبية احتياجاتك من خلال تقليل تجميع العمل وإعداد البيانات والعديد من جولات التدريب الأقل مقابل التدريب من البداية. انظر المزيد حول فوائد الضبط الدقيق أدناه.
مجموعة واسعة من الشركات عبر الصناعات، من الشركات الناشئة إلى الشركات متعددة الجنسيات، هي نماذج دقيقة تم تدريبها مسبقًا. في الواقع، أصبحت ممارسة قياسية لأي مؤسسة تتطلع إلى استخدام الذكاء الاصطناعي لأنها تتيح لها نشر أنظمة مصممة خصيصًا لتلبية احتياجاتها الخاصة دون الاستثمار الهائل المطلوب لتدريب النماذج على نطاق واسع. فيما يلي بعض أمثلة حالات الاستخدام.
تقدم المؤسسات التي تعمل في التمويل والخدمات اللوجستية والرعاية الصحية والعديد من المجالات الأخرى الذكاء الاصطناعي التوليدي مضبوط بشكل دقيق لعملياتها اليومية. ستساعدك هذه القصص في العالم الحقيقي على استكشاف مجموعة واسعة من حالات الاستخدام المباشر. فيما يلي ثلاثة أمثلة محددة:
يتطور ضبط الذكاء الاصطناعي بسرعة، خاصة وأن المزيد من وكلاء الذكاء الاصطناعي يعتمدون على النماذج المضبوطة. يعد المستقبل بمزيد من الأتمتة والتقنيات الجديدة ومجموعة أوسع من خيارات النماذج التي يمكن أن تساعد المؤسسات على تكييف نماذج الذكاء الاصطناعي مع احتياجاتها.
تتضمن هذه الابتكارات خدمات تعلم آلي محسنة تؤتمت الضبط الدقيق، بما في ذلك تحسين المعلمات الفائقة واختيار النماذج والمعالجة المسبقة للبيانات. نتوقع أن تساعد تقنيات زيادة البيانات المراعية للسياق النموذج على تعلم المزيد من الميزات ذات الصلة بسرعة أكبر، ويسمح التعلم الديناميكي للنموذج بتعديل معدل التعلم الخاص به بسرعة. وابحث عن أدوات إنشاء نماذج التعلم الآلي والأساس لمواصلة إصدار نماذج أكثر تنوعًا وقوة يمكنها نقل المعرفة عبر أساليب مختلفة ويمكن ضبطها لأداء المهام التي تتطلب فهم أنواع متعددة من البيانات. ستكون الحيلة هي إنشاء بنية تحتية للبيانات متعددة الاستخدامات بما يكفي للاستفادة من هذه الابتكارات الجديدة عند وصولها.
هل تعلم أن البنية التحتية من Oracle Cloud (OCI) تمنحك الوصول إلى ما تحتاجه لضبط نماذج التعلم الآلي والأساس؟ توفر Oracle البنية التحتية المادية والبنية التحتية لمعالجة البيانات ومنصة علوم البيانات وخدمات الذكاء الاصطناعي التوليدي في الخدمات المُدارة بالكامل. على سبيل المثال، توفر خدمة الذكاء الاصطناعي التوليدي من OCI تكاملًا بسيطًا وسلسًا مع نماذج اللغات الكبيرة متعددة الاستخدامات في خدمة سهلة الاستخدام. استخدمه لضبط النماذج لمجموعة واسعة من حالات الاستخدام، بما في ذلك المساعدة في الكتابة والتلخيص والتحليل والمحادثة.
وفي الوقت نفسه، يمكن لعلماء البيانات ومهندسي التعلم الآلي الاستفادة من منصة علوم البيانات من Oracle للتعاون على إنشاء نماذج التعلم الآلي والتدريب عليها ونشرها باستخدام Python والأدوات مفتوحة المصدر. توفر البيئة المستندة إلى JupyterLab جميع الموارد اللازمة لتجربة النماذج وتطويرها وتوسيع نطاق التدريب على النماذج باستخدام وحدات معالجة الرسومات NVIDIA والتدريب الموزع. يمكنك نقل النماذج إلى الإنتاج والحفاظ على سلامتها من خلال إمكانات عمليات التعلم الآلي، مثل مسارات العمليات المؤتمتة وعمليات نشر النماذج ومراقبة النماذج.
إن الضبط الدقيق لنموذج الذكاء الاصطناعي هو مجرد طريقة واحدة يمكنك من خلالها الاستفادة من هذه التكنولوجيا للحصول على قفزة في المنافسة. تحقق من المزيد من الطرق التي يمكن للشركات الاستفادة منها.
كيف يختلف الضبط الدقيق عن الأنواع الأخرى من تدريب النماذج؟
تختلف نماذج الذكاء الاصطناعي للضبط الدقيق عن تدريب نماذج الذكاء الاصطناعي من البداية. إنها عملية إضافة جولات من التدريب إلى نموذج أساس متطور، مما يؤدي إلى مخرجات أكثر صلة بالسياق في مهمة محددة. غالبًا ما يتطلب الضبط الدقيق بيانات أقل وأقل استهلاكًا للوقت ومكلفًا من إنشاء نموذج من البداية وتدريبه.
هل يمكن استخدام الضبط الدقيق مع أي نوع من النماذج؟
يمكن استخدام الضبط الدقيق للذكاء الاصطناعي مع نماذج الأساس في مجموعة واسعة من حالات الاستخدام، سواء كان ذلك التعرف على الصور أو تصنيف النص أو إنشاء اللغة أو المخرجات الصوتية أو المخرجات الأخرى.