مايكل تشن | خبير استراتيجيات المحتوى | 29 أكتوبر 2024
يمثل التعلم شبه الخاضع إلى الإشراف شكل من أشكال التعلم الآلي الذي ينطوي على كل من مجموعات بيانات التدريب المصنفة وغير المصنفة. كما يستدل من اسمه، تتضمن هذه الطريقة عناصر من كل من التعلم الخاضع إلى الإشراف والتعلم غير الخاضع إلى الإشراف. يستخدم التعلم شبه الخاضع إلى الإشراف عملية من خطوتين. أولاً، يتم تدريب خوارزمية المشروع في البداية باستخدام مجموعة بيانات مصنفة، كما هو الحال في التعلم الخاضع إلى الإشراف. بعد ذلك، تتقدم الخوارزمية من خلال التدريب باستخدام مجموعة بيانات غير مصنفة.
يُعد التعلم شبه الخاضع إلى الإشراف مثاليًا عندما تحتوي المشروعات على الكثير من بيانات التدريب، لكن معظمها أو كلها غير مُصنف. في حالة المشروعات التي لا تتوفر بها سوى بيانات غير مُصنفة، يمكن للتعلم شبه الخاضع إلى الإشراف تشغيل المشروعات من خلال إجراء تدريب أولي باستخدام بيانات مُصنفة يدويًا قبل التبديل إلى بيانات التدريب غير المُصنفة فحسب. في ظل استخدام المشروعات هذا النهج، يجب على الفِرق توخي الحذر عند وضع العلامات يدويًا على البيانات لأنها تصبح الأساس الذي يُبنى عليه باقي المشروع.
يرجع غالبًا قرار استخدام التعلم شبه الخاضع إلى الإشراف إلى مجموعات البيانات المتاحة. في عصر البيانات الضخمة، تكون البيانات غير المُصنفة متاحة ويمكن الوصول إليها أكثر بكثير من البيانات المُصنفة، ووفقًا إلى المصدر تكون تصبح تكلفة الحصول عليها أقل.
مع ذلك، قد يضطر المشروع إلى المُضي قدمًا ببيانات غير مُصنفة فحسب. عندما يحدث ذلك، يجب على الفِرق أن تقرر إذا كان من المُفيد توظيف الطبيعة الاستكشافية للتعلم غير الخاضع إلى الإشراف مقابل قضاء الوقت والمال في تصنيف جزء من مجموعة البيانات كوسيلة للتدريب الأولي على الخوارزمية.
يُعد التعلم شبه الخاضع إلى الإشراف أسلوب يخص التعلم الآلي الذي يقع بين التعلم الخاضع إلى الإشراف والتعلم غير الخاضع إلى الإشراف. إذ يستخدم كلاً من البيانات المُصنفة وغير المُصنفة لتدريب الخوارزميات وقد يحقق نتائج أفضل من استخدام البيانات المُصنفة وحدها.
لتحديد إذا كان التعلم شبه الخاضع إلى الإشراف مُناسبًا للمشروع، يجب على الفِرق طرح الأسئلة بما في ذلك ما يلي:
تحدد الإجابات على هذه الأسئلة الجدوى. بمجرد اتخاذ القرار للعمل مع التعلم شبه الخاضع إلى الإشراف، فتكون الخطوة التالية في إعداد مجموعتين من بيانات التدريب. تكون الأولى مجموعة بيانات صغيرة مُصنفة لترسيخ التدريب التأسيسي للمشروع. تكون مجموعة بيانات التدريب الثانية أكبر—غالبًا أكبر بكثير—وغير مُصنفة. عندما يعالج النظام مجموعة البيانات غير المُصنفة، فإنه ينشئ تصنيفات زائفة باستخدام ما تعلمه من المجموعة المُصنفة. ثم تتكرر هذه العملية لتنقيح الخوارزمية وتحسين الأداء.
فيما يلي أكثر أنواع التعلم شبه الخاضع إلى لإشراف شيوعًا:
على سبيل المثال، قد يبدأ نموذج التنبؤ بالطقس بمجموعة بيانات باستخدام تصنيفات على المقاييس المُسجلة، مثل سرعة الرياح والضغط الجوي والرطوبة، بينما يستخدم النموذج الآخر بيانات أكثر عمومية، مثل الموقع الجغرافي والتاريخ/الوقت ومتوسط هطول الأمطار المُسجل. ينشئ كلا النموذجين تصنيفات زائفة، وعندما يكون لدى نموذج المقاييس درجة احتمالية أعلى من النموذج العام، يتم تطبيق التصنيف الزائف على النموذج العام، والعكس صحيح.
تواصل كل طريقة التدريب على تحسين الجوانب ذات النتائج المنخفضة الاحتمال إلى أن يتم إنتاج نموذج نهائي شامل.
| الإيجابيات | السلبيات |
|---|---|
| أقل تكلفة. من خلال الاستفادة من البيانات غير المُصنفة، يقلل التعلم شبه الخاضع إلى الإشراف من الحاجة إلى تصنيف شامل على البيانات اليدوية، مما يوفر الوقت والمال. | حساس لجودة البيانات المُصنفة. تؤثر دقة البيانات المُصنفة وأهميتها بشكل كبير على أداء النموذج، لذلك؛ يجب تخصيص الرعاية والمال لضمان تصنيف الجودة. |
| تحسين أداء النموذج. في كثير من الحالات، يمكن لنماذج التعلم شبه الخاضعة إلى الإشراف تحقيق دقة أفضل مُقارنة بالنماذج المُدربة فحسب على البيانات المُصنفة، خاصةً عندما تكون البيانات المُصنفة نادرة. | غير مناسب لمجموعات البيانات المُعقدة والمتنوعة. قد يواجه النموذج صعوبة في اكتشاف علاقات ذات معنى بين البيانات المُصنفة وغير المُصنفة إذا كان البنية الأساس مُعقدة للغاية. |
| فعَّال للبيانات غير المُنظمة. يكون التعلم شبه الخاضع إلى الإشراف مناسب بشكل خاص للمهام مثل تصنيف النص أو الفيديو أو الصوت، إذ تكون فيه البيانات غير المُصنفة غالبًا وفيرة. | الشفافية المحدودة. يمكن أن يكون فهم طريقة وصول نموذج التعلم شبه الخاضع إلى الإشراف إلى توقعاته والتحقق من الدقة أصعب مُقارنة بالتعلم الخاضع إلى الإشراف. |
يجمع التعلم الآلي شبه الخاضع إلى الإشراف بين بنية إطلاق مشروع باستخدام التعلم الخاضع إلى الإشراف ومزايا التعلم غير الخاضع إلى الإشراف، مثل الكشف المُتقدم عن أوجه الخلل والقدرة على الكشف عن الأنماط والبُنى الخفية داخل البيانات غير المُصنفة. مع أن مرونته المتأصلة غير ملائمة لكل حالة، فإنه يجعلها خيارًا مُمكنًا لمجموعة واسعة من احتياجات المشروع وأهدافه.
قد تجد الشركات التي تكافح لتطوير استراتيجية الذكاء الاصطناعي أن إنشاء مركز امتياز يضعها على طريق النجاح المستدام. تعرَّف على السبب واحصل على خارطة طريق لإنشاء مركز تميزك الآن.
ما هي الحالات التي يستخدم فيها التعلم شبه الخاضع إلى الإشراف عادةً؟
يعمل التعلم شبه الخاضع إلى الإشراف بشكل أفضل عندما تتمتع المشروعات بإمكانية الوصول إلى البيانات غير المُصنفة فحسب أو في الغالب. في هذه الظروف، يمكن للفِرق تصنيف مجموعة فرعية من البيانات يدويًا لإنشاء مجموعة بيانات التدريب للخطوة الأولى، ثم السماح للنموذج باستكشاف مجموعة البيانات غير المُصنفة.
ما هو الفَرق بين التعلم شبه الخاضع إلى الإشراف وغير الخاضع إلى الإشراف؟
يسمح التعلم غير الخاضع إلى الإشراف للنماذج باستكشاف مجموعات البيانات غير المُصنفة بهدف اكتشاف الأنماط والعلاقات بين المدخلات والمخرجات بمفردها. يستخدم التعلم شبه الخاضع إلى الإشراف هذه الطريقة، لكن مع خطوة سابقة لتدريب الخوارزمية على مجموعة بيانات صغيرة مُصنفة لبناء اتجاه أساس للمشروع.
ما هي بعض إيجابيات التعلم شبه الخاضع إلى الإشراف وسلبياته؟
تشمل إيجابيات التعلم شبه الخاضع إلى الإشراف ما يلي:
تشمل سلبيات التعلم شبه الخاضع إلى الإشراف ما يلي: