التعلم الآلي الداخلي في قاعدة البيانات من خلال HeatWave AutoML

مايكل تشن | خبير استراتيجيات المحتوى | 15 أكتوبر 2024

يشير التعلم الآلي داخل قاعدة البيانات إلى دمج خوارزميات وتقنيات التعلم الآلي في نظام إدارة قاعدة البيانات. تبقى جميع العمليات - بما في ذلك تحديد مجموعة البيانات وخوارزميات التدريب وتقييم النماذج - داخل قاعدة البيانات. باستخدام التعلم الآلي داخل قاعدة البيانات، يمكن للمؤسسات أداء المهام التحليلية المعقدة مباشرةً داخل قواعد بياناتها، مما يلغي الحاجة إلى نقل البيانات بين الأنظمة. يؤدي ذلك إلى إزالة زمن الوصول وسلامة البيانات والمخاوف الأمنية المتعلقة بعمليات استيراد/تصدير البيانات.

فكر في شركة تواجه فجأة الكثير من انحسار العملاء. قد تتنبأ خوارزميات التعلم الآلي، أو التعلم الآلي، بالعملاء الذين من المحتمل أن يقوموا بفك تشفيرهم أمام منافس واقتراح حملات تسويقية مُخصصة وتقديم توصيات أخرى حول كيفية إعادة إشراك هؤلاء المشترين. ربما لديك مخزون زائد من العناصر التي يتم شراؤها بشكل متكرر. يمكن أن يؤدي تقديم عرض ترويجي خاص إلى نقل المخزون وجعل العملاء سعداء. إذا كان التعلم الآلي متاحًا مباشرةً داخل قاعدة البيانات، فيمكن إنشاء هذه الاقتراحات بشكل أسرع، على أحدث البيانات. يمكن للشركة أن تتحول بسرعة. ونظرًا لعدم الحاجة إلى نقل البيانات إلى محرك تعلّم آلي خارجي، يتم التخلص من المخاوف بشأن الكشف عن معلومات العملاء.

ما الذي يُضمّن التعلم الآلي في قاعدة البيانات؟

يأتي التعلم الآلي داخل قاعدة البيانات بخوارزميات التعلم الآلي مباشرةً إلى قاعدة البيانات، مما يلغي الحاجة إلى نقل البيانات ذهابًا وإيابًا بين الأنظمة المختلفة. تقليديًا، كان التعلم الآلي يتطلب استخراج البيانات من قاعدة البيانات ومعالجتها في منصة أو أداة تحليلات ML منفصلة. قد يستغرق ذلك وقتًا طويلاً ويستهلك الكثير من الموارد، خاصةً عند التعامل مع مجموعات البيانات الكبيرة.

باستخدام التعلم الآلي داخل قاعدة البيانات، تظل البيانات قيد التنفيذ أثناء تنفيذ خوارزميات التعلم الآلي محليًا داخل بيئة قاعدة البيانات. تتمثل إحدى المزايا الرئيسة لتضمين خوارزميات التعلم الآلي في قاعدة البيانات في تحليل أسرع وأكثر كفاءة.

ببساطة، يؤدي نقل البيانات إلى إبطاء كل شيء.

يُعد التعلم الآلي داخل قاعدة البيانات مفيدًا بشكل خاص لمجموعات البيانات الكبيرة اللازمة، على سبيل المثال، لتدريب نماذج الذكاء الاصطناعي. باستخدام التعلم الآلي داخل قاعدة البيانات، تستخدم بيئة قاعدة البيانات أدوات للترميز وإنشاء النماذج والاختبار الأصلية في المنصة. يسمح ذلك باستخدام جميع الجداول في قاعدة البيانات للمشروعات كثيفة البيانات، ببضع نقرات فقط.

كما يوفر التعلم الآلي داخل قاعدة البيانات اتساق البنية التحتية، سواء في التدريب أو النشر، مما يعني أن فرق تكنولوجيا المعلومات يتم تحريرها من إنشاء بنى تحتية جديدة جاهزة للإنتاج - ناهيك عن أعمال الصيانة وضمان الجودة ذات الصلة - لدعم المراحل التالية من استخدام النموذج.

النقاط الرئيسة

  • يتيح التعلم الآلي داخل قاعدة البيانات للمؤسسات إنشاء التعليمات البرمجية لنماذج التعلم الآلي وإنشائها واختبارها ونشرها داخل بيئة قاعدة البيانات.
  • من خلال البقاء داخل قاعدة البيانات، تنتقل عملية التعلم الآلي بكفاءة أكبر بكثير.
  • غالبًا ما تكون النماذج التي تم إنشاؤها باستخدام التعلم الآلي داخل قاعدة البيانات أقل تعقيدًا من تلك التي تم إنشاؤها باستخدام أدوات مستقلة لأنها تعتمد على الميزات المتاحة داخل البيئة.

شرح التعلّم الآلي المضمّن في قاعدة بيانات

يعد التعلم الآلي داخل قاعدة البيانات تجربة سلسة لأن الموظفين يعملون مع أنظمة وأدوات قواعد البيانات المألوفة لديهم. وبالمثل، يمكن للمحللين استخدام قواعد بياناتهم الحالية ولغات الاستعلام المألوفة لإجراء تحليلات متقدمة دون الحاجة إلى استثمارات إضافية في البرامج أو الأجهزة. من خلال تحليل البيانات مباشرةً داخل قاعدة البيانات، يمكن للمؤسسات الكشف عن رؤى قيمة حول أحدث البيانات واتخاذ قرارات قائمة على البيانات في الوقت المناسب.

بدون التعلم الآلي داخل قاعدة البيانات، ستحتاج الشركات التي تتطلع إلى تطبيق تحليلات التعلم الآلي على بياناتها إلى إجراء عمليات الاستخراج/التحويل/التحميل (ETL) أو الاستخراج/التحميل/التحويل (ELT) وتحويل البيانات إلى أنظمة خارجية. بموجب هذا النموذج التقليدي، قد يقوم علماء البيانات بإجراء عمليات استيراد/تصدير يدوية، أو قد يتم دمج الأنظمة عبر واجهات برمجة التطبيقات؛ في كلتا الحالتين، من الضروري اتخاذ خطوات إضافية متعددة لجعل مجموعات البيانات جاهزة لوظائف التعلم الآلي—وتلك الخطوات الإضافية تفتح الباب أمام المشكلات المحتملة، بما في ذلك:

  • أخطاء بيانات مكررة
  • أخطاء تلف البيانات
  • عيوب أمنية
  • استخدام الموارد والحوسبة الزائدة والتكاليف المرتبطة
  • مشكلات توافق التكامل
  • مشكلات توافق التنسيق

يتخطى التعلم الآلي داخل قاعدة البيانات خطوات التصدير/الاستيراد، مما يحافظ على مهام التعلم الآلي في نفس بيئة البيانات نفسها دون الحاجة إلى إعادة البناء أو إعادة صياغة الجهود لضمان التوافق. كما أن البقاء داخل قاعدة البيانات يزيل الحاجة إلى الحفاظ على الأنظمة القادرة على التعامل مع الانتقال.

أهمية التعلم الآلي المضمّن في قاعدة بيانات

على نطاق واسع، يوجد عدد من العقبات عند استخدام مجموعة متنوعة من مصادر البيانات لمهام التعلم الآلي، وخاصةً تدريب نموذج الذكاء الاصطناعي. وهي تشمل ما يلي:

  • قيود تدريب النموذج. نظرًا لأن العديد من مجموعات البيانات كبيرة جدًا بحيث لا تخضع باستمرار لمعالجة ETL/ELT، تستخدم فرق البيانات عادةً مجموعات فرعية فقط من بياناتها لتدريب النماذج. ينشئ هذا قيودًا، إذ يمكن تدريب النماذج على البيانات التي لا تمثل مجموعة كاملة للسيناريوهات التي ستواجهها عند نشرها في "العالم الحقيقي".
  • تعقيد مصادر البيانات. يمكن أن تكون مصادر البيانات أجهزة استشعار Internet of Things (IoT) كثيرة ومتنوعة في الوقت الفعلي في مصنع وقواعد بيانات العملاء ذات التواريخ الطويلة والعديد من المجالات وملفات سجل الأمان الضخمة. يؤدي عدم وجود تنسيق واحد وموحد ومبسط إلى حدوث مشكلات للتطبيقات، بما في ذلك أنظمة التحليل الذكي للأعمال، ناهيك عن الوظائف الأكثر تعقيدًا، مثل التعلم الآلي.

يعد التعلم الآلي داخل قاعدة البيانات مهمًا لفرق البيانات في الوقت الحالي بسبب النمو السريع والمستمر لحجم البيانات وتنوعها. ببساطة، ستصبح المهام كثيفة البيانات أكثر صعوبة، وليس أسهل، لذلك من المهم أكثر من أي وقت مضى دمج التعلم الآلي داخل قاعدة البيانات في عمليات سير العمل.

كيف يعمل التعلم الآلي داخل قاعدة البيانات؟

يعمل التعلم الآلي داخل قاعدة البيانات بشكل مشابه للتعلم الآلي القياسي في أبسط صوره. الفرق الأساس هو أن جميع الخطوات اللازمة لنقل البيانات بين الأنظمة - من المستخلصات إلى التحويل/التنظيف - تتم إزالتها ببساطة. ومع ذلك، فإن هذا يأتي مع بعض القيود والمتطلبات بسبب طبيعة العمل داخل بيئة قاعدة البيانات.

بخطوط عريضة، إليك طريقة عمل التعلم الآلي داخل قاعدة البيانات.

1. تحميل البيانات ومعالجتها مسبقًا في قاعدة بيانات تحليلات

يبدأ كل شيء بالحمل الأولي في قاعدة البيانات، على الرغم من أنه لأغراض التعلم الآلي داخل قاعدة البيانات، لا يزال هناك تحذير واحد: يجب أن تدعم قاعدة البيانات الإمكانية - على وجه التحديد، الحفاظ على التعليمات البرمجية بالقرب من البيانات للسماح بتحسينات الكفاءة الكاملة الممكنة مع التعلم الآلي داخل قاعدة البيانات.

2. تحسين خوارزميات التعلم الآلي

سواء كانت خوارزميات التعلم الآلي موجودة في قاعدة البيانات أو في منصة تابع لجهة خارجية، فإنها لا تزال بحاجة إلى الخضوع لعملية التحسين المطلوبة. وهذا يعني تدريب النموذج وتقييم النتائج والضبط حسب الحاجة. يكمن الاختلاف الأكبر في التعلم الآلي داخل قاعدة البيانات في تنفيذ هذه الخطوات داخل قاعدة البيانات، وليس في نظام منفصل عن مكان تخزين البيانات. وهذا يلغي الحاجة إلى نقل البيانات بين أنظمة ومخازن بيانات مختلفة متعددة لأداء مهام تحسين النماذج.

3. يستخدم علماء البيانات واجهات برمجة تطبيقات متخصصة لتدريب التعلم الآلي

في التعلم الآلي التقليدي، يجب نقل البيانات من قواعد البيانات إلى مستودع، مثل بحيرة البيانات، لتدريب النموذج وتقييم النتائج وتنفيذ التحسينات مثل تعديل الخوارزميات والمعلمات الفردية. تستخدم هذه الخطوات موارد الحوسبة، مما يقلل من وزن البنية التحتية. يمكن لواجهات برمجة التطبيقات الأصلية لقاعدة البيانات التعامل مع هذه المهام، حتى مع انتقال النموذج من التطوير إلى الاختبار إلى بيئات الإنتاج.

4. يمكن تنفيذ الرؤى التنبؤية مباشرةً على الأنظمة التشغيلية دون انقطاع

باستخدام التعلم الآلي داخل قاعدة البيانات، يمكن نشر مراجعات نموذج التعلم الآلي إلى قواعد بيانات أخرى، سواء في بيئات التطوير أو الاختبار أو الإنتاج، ببساطة عن طريق إصدار إصدار جدول. تتكامل التحسينات على الفور، مما يسمح بتنفيذ الوظائف دون انقطاع عن الخطوات الإضافية أو موارد الحوسبة المدمجة.

5. يتم إرجاع النتائج على الفور مع تحسين الدقة

عند إنشاء الرؤى باستخدام نماذج التعلم الآلي مباشرةً داخل قاعدة البيانات، تكون النتيجة رؤى فورية تقريبًا دون خطوات أو مخاوف إضافية بشأن زمن انتقال ETL/ELT وتكامل البيانات.

مزايا التعلم الآلي داخل قاعدة البيانات مقارنة بالأساليب الأخرى

يعمل التعلم الآلي داخل قاعدة البيانات بشكل طبيعي على تقصير العمليات وتقليل احتياجات الأجهزة للمؤسسات، مما ينتج عنه عددًا من المزايا. في حين أن هذا النهج يأتي مع مجموعة من القيود الخاصة بها، والفوائد المشتركة هي كما يلي:

معالجة تحليلات أسرع

إن نقل البيانات بين الأنظمة أمر مرهق في أحسن الأحوال. في أسوأ الأحوال، يمكن أن تحدث أخطاء وزمن انتقال ومخاطر أمنية مع إبطاء العمليات. من خلال الحفاظ على مهام التحليل داخل قاعدة البيانات، يتم نفي العقبات الإضافية التي تنطوي عليها ELT/ETL—من خلال التصدير وتحويل البيانات والتحميل—، مما يضمن تحرك عملية التحليلات الشاملة بأسرع ما يمكن.

تكلفة ملكية منخفضة

عندما تزيل المؤسسة الحاجة إلى تحويل مجموعات البيانات الكبيرة، فإنها تحقق وفورات في التخزين وعمالة الخبراء، بالإضافة إلى زمن انتقال أقل. في النهاية، فالوقت من ذهب. بالإضافة إلى ذلك، تعمل الكفاءة المحسنة على تقليل الساعات المستغرقة في استكشاف مشكلات الأجهزة والبرامج وإصلاحها للحصول على مستوى ثانوي من خفض التكلفة.

زيادة قابلية التوسع

تعتمد قابلية التوسع غالبًا على الموارد: كلما زادت الحاجة إلى المال أو القوى العاملة أو وحدات المعالجة المركزية للعملية، زادت صعوبة التوسع عند الطلب. تؤدي إزالة عمليات نقل البيانات إلى التخلص من قوة الحوسبة الإضافية اللازمة لإكمال الخطوات مثل التصدير أو تحويل التنسيق. يقلل الاحتفاظ بالبيانات داخل قاعدة البيانات من الحاجة إلى معالجة مشكلات التوافق وتحسين كفاءة الحوسبة، مما يوفر مرونة أكبر بكثير وتوسعًا أسهل لتلبية الطلب.

تحسين الأداء والدقة

تعد عمليات ELT/ETL مصدرًا أساسًا للبيانات المكررة داخل الشبكة. يمكن أن ينبع التكرار من العديد من المصادر، مثل مشكلة في الأجهزة تقاطع التصدير تاركًا البيانات التالفة، أو مشكلات في أدوات تحويل البيانات تؤدي إلى التحرير أو الحذف العرضي. تفتح كل خطوة من خطوات عملية ELT/ETL مخاطر يمكن أن تضر بجودة ودقة مجموعة البيانات مع إبطاء كفاءة العملية.

النشر والصيانة المؤتمتين

يحافظ التعلم الآلي داخل قاعدة البيانات على البيانات في مكان واحد. وهذا يلغي الحاجة إلى نقل البيانات، مما يقلل من التصدير/الاستيراد والمدخلات/المخرجات. ونتيجة لذلك، يمكن أن تحدث العمليات داخل البيئة الأصلية، دون الاعتماد على أنظمة أخرى. يؤدي ذلك إلى تحرير أدوات وإمكانات الأتمتة لمختلف المهام، مثل عمليات فحص النشر والتدقيق والصيانة. يمكن للمستخدمين الاستفادة من هذه الميزات دون القلق بشأن مشكلات التوافق أو التكامل التي قد تنشأ.

أدوات التعلم الآلي وخدماته المضمّن في قاعدة البيانات

تأتي أدوات التعلم الآلي داخل قاعدة البيانات في مجموعة متنوعة من الخدمات والإمكانات. في كثير من الحالات، تشبه هذه الأدوات ما قد يوفره مورد قاعدة البيانات كإمكانات مستقلة، إما كمجموعة فرعية من الميزات المتكاملة أو كاتصال مضمن بمنصة التعلم الآلي للمورد. على سبيل المثال، توفر Oracle Database إمكانات التعلم الآلي داخل البيئة للقضاء على الحاجة إلى نقل البيانات من نظام إلى نظام. في هذه الحالة، توفر Oracle Database الاستكشاف والإعداد والنمذجة باستخدام أدوات Oracle Machine Learning، مثل SQL وR وPython وREST والتعلم الآلي المؤتمت (AutoML) والواجهات بدون تعليمات برمجية، إلى جانب مجموعة متنوعة من الخوارزميات المتاحة.

لقطة شاشة للوحة معلومات Oracle Machine Learning

العيوب التعلمية الآلية المضمّنة في قاعدة البيانات

على الرغم من أنه يأتي مع مزايا جذابة، إلا أن التعلم الآلي داخل قاعدة البيانات يعتمد بشكل كبير على ميزات وإمكانات بيئة قاعدة البيانات. قد يؤدي هذا إلى مشكلات في الترحيل المستقبلي أو عندما يتطلب نموذج التعلم الآلي شيئًا يتجاوز الإمكانات الأصلية للبيئة.

تشمل العيوب والقيود الأكثر شيوعًا للتعلم الآلي داخل قاعدة البيانات ما يلي:

صعوبة نشر النماذج

إذا كان كل شيء يتوافق مع احتياجات وأهداف التعلم الآلي للمشروع، فإن الانتقال من الاختبار إلى النشر هو في الواقع خطوة بسيطة. ومع ذلك، تستند هذه النماذج إلى الإمكانات المحددة للأدوات داخل قاعدة البيانات الخاصة بالمؤسسة. ماذا يحدث عندما يتطور المشروع إلى شيء أكثر تعقيدًا أو يتطلب الترحيل؟ يمكن أن يجعل العمل باستخدام الأدوات داخل قاعدة البيانات حمل عمل التعلم الآلي الفوري أسرع وأكثر كفاءة، لكن المستقبل يمكن أن يكون علامة استفهام، لذلك من الضروري التفكير في ما إذا كانت الأهداف طويلة الأجل تتوافق مع الإمكانات الحالية.

تعقيد النموذج المحدود

يعمل التعلم الآلي داخل قاعدة البيانات فقط على تطبيقات قاعدة البيانات المدعومة وقد يوفر مجموعة محدودة من واجهات برمجة التطبيقات. ويتغير هذا مع نمو إمكانات أنظمة التعلم الآلي داخل قاعدة البيانات، ولكن كقاعدة عامة، توفر الأدوات المستقلة المزيد من القوة والميزات، إلى جانب كمية هائلة من المتخصصين المتاحين لمساعدة الشركات على استغلال هذه الميزات.

نقص شفافية البيانات

تؤدي أكبر قوة للتعلم الآلي داخل قاعدة البيانات أيضًا إلى واحدة من أكبر عيوبها: من خلال الحفاظ على البيانات داخل بيئة قاعدة البيانات، يتم تخطي خطوات ETL/ELT—لكن هذا يعني تجاوز فرص التدقيق وتنقيح البيانات أيضًا.

القيود على الحوسبة

في كثير من الحالات، لن تشترك قواعد البيانات في نفس موارد الحوسبة مثل أدوات التعلم الآلي، خاصةً بالنسبة للنماذج واسعة النطاق أو شديدة التعقيد التي تتطلب حوسبة عالية الأداء. ولهذا السبب، غالبًا ما يكون لنطاق نماذج التعلم الآلي داخل قاعدة البيانات حد أقصى. يختلف كل إعداد تنظيمي؛ وبالمثل، تختلف احتياجات كل مشروع، وهذا مفاضلة يجب مراعاتها خلال مراحل التخطيط الأولية.

بدء استخدام التعلم الآلي داخل قاعدة البيانات باستخدام HeatWave AutoML

يوفر HeatWave الذكاء الاصطناعي المؤتمت والمتكامل والآمن والتعلم الآلي المؤتمت والمكون في خدمة سحابة واحدة للمعاملات والتحليلات التي على نطاق مستودع البيانات. يتضمن HeatWave AutoML كل ما يحتاجه المستخدمون لإنشاء نماذج التعلم الإلكتروني عليها والتدريب عليها وشرحها ضمن HeatWave دون أية تكلفة إضافية. باستخدام التعلّم الآلي داخل قاعدة بيانات في HeatWave، لا يحتاج العملاء إلى نقل البيانات إلى خدمة تعلّم آلي منفصلة. يمكنك تطبيق تدريب التعلّم الآلي والاستنتاج والشرح بسهولة وأمان على البيانات المخزنة داخل MySQL وفي مخزن الكائنات. تتوفر HeatWave على Oracle Cloud Infrastructure وAmazon Web Services وMicrosoft Azure.

للبدء، تحتاج المؤسسات إلى التأكد من أن قاعدة البيانات الخاصة بها توفر التعلم الآلي داخل قاعدة البيانات، والذي يمكن أن يكون تغييرًا في قواعد البيانات للمؤسسات التي تتطلع إلى الاستفادة الكاملة من قوة التعلم الآلي. من خلال إدخال خوارزميات التعلم الآلي إلى البيانات، بدلاً من العكس، يكتسب صانعو القرار تحليلاً أسرع وأكثر كفاءة.

البيانات والذكاء الاصطناعي: دليل كبار مسؤولي المعلومات للنجاح

تأتي نماذج الذكاء الاصطناعي في العديد من الأحجام ومستويات التعقيد، بدءًا من نماذج اللغات الكبيرة إلى نماذج التعلم الآلي الأبسط. ما الذي يشترك فيه الجميع؟ التعطش إلى البيانات. فيما يلي 4 مكونات للبنية التحتية للبيانات الجاهزة للذكاء الاصطناعي.

الأسئلة الشائعة حول التعلم الآلي المضمّن في قاعدة البيانات

كيف يمكن استخدام التعلم الآلي داخل قاعدة البيانات بفعالية؟

يعمل التعلم الآلي داخل قاعدة البيانات فقط عندما تستخدم الشركات قاعدة بيانات تدعم الإمكانات داخل قاعدة البيانات. يجب مراعاة أساس قاعدة البيانات هذه لموارد الحوسبة، إلى جانب حجم ونطاق قاعدة البيانات ونموذج التعلم الآلي.

ما مزايا التعلّم الآلي داخل قاعدة البيانات؟

يزيل التعلم الآلي داخل قاعدة البيانات الحاجة إلى استخراج البيانات ونقلها بين الأنظمة. ينشئ هذا مجموعة طبيعية من الفوائد من حيث الكفاءة، وفي بعض الحالات، يمكن أن يتقلص أوقات العمليات من أسابيع إلى أيام لأنه يلغي الحاجة إلى الاعتماد على الأدوات الخارجية لـ ETL / ELT. ومن منظور الصورة الكبيرة، يقلل هذا أيضًا من تكلفة الملكية ويزيد من قابلية التوسع والكفاءة التشغيلية من خلال استخدام موارد أقل.

ما بعض المشكلات التي يجب مراعاتها عند استخدام التعلم الآلي داخل قاعدة البيانات؟

قبل اتخاذ قرار باستخدام التعلم الآلي داخل قاعدة البيانات لمشروع، يجب على الفرق تقييم العوامل التالية:

  • ما مدى سرعة تحرك المشروع؟
  • ما مدى تعقيد النموذج؟
  • هل يحتاج المتخصص إلى الوصول إلى النموذج أو البيانات؟ إذا كان الأمر كذلك، فما الأدوات التي يفضلها؟
  • ما نوع موارد الحوسبة المتوفرة لقاعدة البيانات مقارنة بأدوات التعلم الآلي المستقلة؟

يمكن لهذه الأسئلة أن توضح إيجابيات وسلبيات التعلم الآلي داخل قاعدة البيانات ويجب النظر فيها لكل مشروع.

ما هي بعض الاتجاهات المستقبلية في التعلم الآلي داخل قاعدة البيانات؟

يواصل الموفرون تحسين قدراتهم على التعلم الآلي داخل قاعدة البيانات وتوسيعها، وهذا يعني أن هناك عددًا من الاتجاهات في الأفق. نظرًا لأن المزيد والمزيد من الأدوات والمنصات تدعم التعلم الآلي داخل قاعدة البيانات، سيتمكن علماء البيانات من إنشاء نماذج أكثر تعقيدًا ونشرها. يوفر هذا أيضًا شفافية أكبر لأن النموذج موجود على منصة موحدة بدلاً من الاقتصار على مَن يستخدم أدوات التعلم الآلي ويعززها. تعني الإمكانات الأكبر أيضًا قابلية الاستخدام مع مجموعات بيانات أكبر، وبالتالي تدريب واختبار ونشر أسرع.