مايكل تشن | خبير استراتيجي للمحتوى | 15 أكتوبر 2024
يشير التعلم الآلي داخل قواعد البيانات إلى دمج خوارزميات وتقنيات التعلم الآلي في نظام إدارة قواعد البيانات. تبقى جميع العمليات—بما في ذلك تحديد مجموعة البيانات وخوارزميات التدريب وتقييم النماذج—داخل قاعدة البيانات. باستخدام التعلم الآلي داخل قواعد البيانات، يمكن للمؤسسات أداء المهام التحليلية المُعقدة مباشرةً داخل قواعد بياناتها، مما يلغي الحاجة إلى نقل البيانات بين الأنظمة. يؤدي ذلك إلى إزالة زمن الوصول وسلامة البيانات والمخاوف الأمنية المُتعلقة بعمليات استيراد/تصدير البيانات.
فكِّر في شركة تواجه فجأة الكثير من تسرب العملاء. قد تتنبأ خوارزميات التعلم الآلي، أو ML بالعملاء الذين من المحتمل أن يرحلوا إلى منافس واقتراح حملات تسويقية مُخصصة وتقديم توصيات أخرى حول طريقة إعادة إشراك هؤلاء المشترين. ربما تمتلك مخزون زائد من العناصر التي يتم شراؤها بشكل مُتكرر. يمكن أن يؤدي تقديم عرض ترويجي خاص إلى نقل المخزون وجعل العملاء سعداء. إذا كان التعلم الآلي متاحًا مباشرةً داخل قواعد البيانات، فيمكن إنشاء هذه الاقتراحات أسرع، وعلى أحدث البيانات. يمكن للشركة أن تتحول بسرعة. نظرًا إلى عدم الحاجة إلى نقل البيانات إلى محرك ML خارجي، فيمكن التخلص من المخاوف بشأن الكشف عن معلومات العملاء.
يُدخل التعلم الآلي داخل قواعد البيانات خوارزميات التعلم الآلي مباشرةً إلى قاعدة البيانات، مما يلغي الحاجة إلى نقل البيانات ذهابًا وإيابًا بين الأنظمة المُختلفة. تقليديًا، تطلب التعلم الآلي استخراج البيانات من قاعدة البيانات ومعالجتها في منصة أو أداة تحليلات ML مُنفصلة. قد يستغرق هذا وقتًا طويلاً ويستهلك الكثير من الموارد، خاصةً عند التعامل مع مجموعات البيانات الكبيرة.
باستخدام التعلم الآلي داخل قواعد البيانات، تظل البيانات قيد التنفيذ أثناء تنفيذ خوارزميات التعلم الآلي محليًا داخل بيئة قاعدة البيانات. تتمثل إحدى المزايا الرئيسة لتضمين خوارزميات التعلم الآلي داخل قواعد البيانات في الوصول إلى تحليل أسرع وأكفأ.
ببساطة، يؤدي نقل البيانات إلى إبطاء كل شيء.
يُعد التعلم الآلي داخل قواعد البيانات مُفيدًا بشكل خاص لمجموعات البيانات الكبيرة اللازمة، على سبيل المثال، لتدريب نماذج الذكاء الاصطناعي. مع التعلم الآلي داخل قواعد البيانات، تستخدم بيئة قاعدة البيانات أدوات للترميز وإنشاء النماذج والاختبارات الأصلية في المنصة. يسمح ذلك باستخدام جميع الجداول في قاعدة البيانات للمشروعات كثيفة البيانات، وذلك ببضع نقرات فحسب.
كما يوفر التعلم الآلي داخل قواعد البيانات اتساق البنية التحتية، سواء في التدريب أو النشر، مما يعني أن فِرق تكنولوجيا المعلومات يتم تحريرها من إنشاء بُنى تحتية جديدة جاهزة للإنتاج—ناهيك عن أعمال الصيانة وضمان الجودة ذات الصلة—لدعم المراحل التالية من استخدام النموذج.
النقاط الرئيسة
يُعد التعلم الآلي داخل قواعد البيانات تجربة سَلسة لأن الموظفين يعملون مع أنظمة وأدوات قواعد البيانات المألوفة لديهم. بالمثل، يمكن للمحللين استخدام قواعد بياناتهم الحالية ولغات الاستعلام المألوفة لإجراء تحليلات مُتقدمة دون الحاجة إلى استثمارات إضافية في البرامج أو الأجهزة. من خلال تحليل البيانات مباشرةً داخل قاعدة البيانات، يمكن للمؤسسات الكشف عن رؤى قيِّمة حول أحدث البيانات واتخاذ قرارات قائمة على البيانات في الوقت المناسب.
دون التعلم الآلي داخل قواعد البيانات، تحتاج الشركات التي تتطلع إلى تطبيق تحليلات التعلم الآلي على بياناتها إلى إجراء عمليات الاستخراج/التحويل/التحميل (ETL) أو الاستخراج/التحميل/التحويل (ELT) مع تحويل البيانات إلى أنظمة خارجية. بموجب هذا النموذج التقليدي، قد يجري علماء البيانات عمليات استيراد/تصدير يدوية، أو قد يتم دمج الأنظمة عبر واجهات API؛ من الضروري في كلتا الحالتين اتخاذ خطوات إضافية متعددة لجعل مجموعات البيانات جاهزة إلى وظائف التعلم الآلي—كما تفتح تلك الخطوات الإضافية الباب أمام المشكلات المحتملة، بما في ذلك ما يلي:
يتخطى التعلم الآلي داخل قاعدة البيانات خطوات التصدير/الاستيراد، مما يحافظ على مهام ML في نفس بيئة البيانات نفسها دون الحاجة إلى إعادة البناء أو إعادة تنسيق الجهود لضمان التوافق. كما يزيل البقاء داخل قاعدة البيانات الحاجة إلى الحفاظ على الأنظمة القادرة على التعامل الوسيط.
على نطاق واسع، يوجد عدد من العقبات عند استخدام مجموعة مُتنوعة من مصادر البيانات لمهام التعلم الآلي، وخاصةً تدريب نموذج الذكاء الاصطناعي. تشمل ما يلي:
يُعد التعلم الآلي داخل قواعد البيانات مهمًا لفِرق البيانات في الوقت الحالي بسبب النمو السريع والمستمر لحجم البيانات وتنوعها. ببساطة، تصبح المهام كثيفة البيانات أصعب، ليس أسهل، لذلك؛ من المهم أكثر من أي وقت مضى دمج التعلم الآلي داخل قاعدة البيانات في عمليات سير العمل.
يعمل التعلم الآلي داخل قواعد البيانات بشكل مشابه للتعلم الآلي القياسي في أبسط صوره. يكمن الفرق الأساس في أن جميع الخطوات اللازمة لنقل البيانات بين الأنظمة—من المستخلصات إلى التحويل/التنظيف—تتم إزالتها ببساطة. مع ذلك، يأتي هذا مع بعض القيود والمتطلبات بسبب طبيعة العمل داخل بيئة قاعدة البيانات.
بخطوط عريضة، إليك طريقة عمل التعلم الآلي داخل قاعدة البيانات.
يبدأ كل شيء بالحمل الأولي في قاعدة البيانات، على الرغم من أنه لأغراض التعلم الآلي داخل قاعدة البيانات، لا يزال يوجد تحذير واحد: يجب أن تدعم قاعدة البيانات الإمكانية—على وجه التحديد، مما يحفاظ على التعليمات البرمجية بالقرب من البيانات للسماح بإجراء تحسينات كاملة على الكفاءة وهي الممكنة مع التعلم الآلي داخل قواعد البيانات.
سواء كانت خوارزميات التعلم الآلي موجودة في قاعدة البيانات أو في منصة تابعة إلى جهة خارجية، فإنها لا تزال بحاجة إلى الخضوع إلى عملية التحسين المطلوبة. يعني هذا تدريب النموذج وتقييم النتائج والضبط حسب الحاجة. يكمن الفَرق الأكبر في التعلم الآلي داخل قواعد البيانات في تنفيذ هذه الخطوات داخل قاعدة البيانات، ليس في نظام مُنفصل عن مكان تخزين البيانات. يلغي هذا الحاجة إلى نقل البيانات بين أنظمة ومخازن بيانات مُختلفة متعددة لأداء مهام تحسين النماذج.
في التعلم الآلي التقليدي، يجب نقل البيانات من قواعد البيانات إلى مستودع، مثل بحيرة البيانات، لتدريب النموذج وتقييم النتائج وتنفيذ التحسينات مثل تعديل الخوارزميات والمعلمات الفردية. تستهلك هذه الخطوات موارد الحوسبة، مما يُقلل من وزن البنية التحتية. يمكن لواجهات API الأصلية لقاعدة البيانات التعامل مع هذه المهام، حتى مع انتقال النموذج من التطوير إلى الاختبار وصولاً إلى بيئات الإنتاج.
باستخدام التعلم الآلي داخل قواعد البيانات، يمكن نشر مراجعات نموذج التعلم الآلي إلى قواعد بيانات أخرى، سواء في بيئات التطوير أو الاختبار أو الإنتاج، وذلك ببساطة عن طريق تعيين إصدار الجدول. تتكامل التحسينات على الفور، مما يسمح بتنفيذ الوظائف دون انقطاع عن الخطوات الإضافية أو موارد الحوسبة المُدمجة.
عند إنشاء الرؤى باستخدام نماذج ML مباشرةً داخل قاعدة البيانات، تكون النتيجة رؤى فورية تقريبًا دون خطوات أو مخاوف إضافية بشأن زمن انتقال ETL/ELT وتكامل البيانات.
يقصِّر التعلم الآلي داخل قواعد البيانات بشكل طبيعي من العمليات ويقلل احتياجات الأجهزة للمؤسسات، مما ينشئ عنه عددًا من المزايا. في حين أن هذا النهج يأتي مع مجموعة من القيود الخاصة به، فتصبح المزايا المُشتركة كما يلي:
يظهر نقل البيانات بين الأنظمة أمر مُرهق في أحسن الأحوال. في أسوأ الأحوال، يمكن أن تُحدث أخطاء وزمن انتقال ومخاطر أمان مع إبطاء العمليات. من خلال الحفاظ على مهام التحليل داخل قواعد البيانات، يتم تجاوز العقبات الإضافية التي تنطوي عليها ELT/ETL—من خلال التصدير وتحويل البيانات والتحميل—، مما يضمن نقل عملية التحليلات الشاملة بأسرع ما يمكن.
عندما تتخلص مؤسسة من الحاجة إلى تحويل مجموعات البيانات الكبيرة، فإنها تحقق وفورات في التخزين والعمالة الخبيرة، بالإضافة إلى زمن انتقال أقل. في النهاية، الوقت يعني المال. بالإضافة إلى ذلك، تخفض الكفاءة المحسنة من الساعات المُستغرقة في استكشاف مشكلات الأجهزة والبرامج وإصلاحها للحصول على مستوى ثانوي من خفض التكلفة.
تعتمد قابلية التوسُّع غالبًا على الموارد كما يلي: كلما زادت الحاجة إلى المال أو القوى العاملة أو وحدات المعالجة المركزية للعملية، زادت صعوبة التوسع عند الطلب. تؤدي إزالة عمليات نقل البيانات إلى التخلص من قوة الحوسبة الإضافية اللازمة لإكمال الخطوات مثل التصدير أو تحويل التنسيق. يقلل الاحتفاظ بالبيانات داخل قاعدة البيانات من الحاجة إلى معالجة مشكلات التوافق وتحسين كفاءة الحوسبة، مما يوفر مرونة أكبر بكثير وتوسُّعًا أسهل لتلبية الطلب.
تُعد عمليات ELT/ETL مصدرًا أساسًا للبيانات المتكررة داخل الشبكة. يمكن أن ينبع التكرار من العديد من المصادر، مثل مشكلة في الأجهزة تقاطع عمل التصدير تاركةً البيانات تالفة، أو مشكلات في أدوات تحويل البيانات تؤدي إلى التحرير أو الحذف العرضي. تفتح كل خطوة من خطوات عملية ELT/ETL الباب أمام مخاطر يمكن أن تضر بجودة مجموعة البيانات ودقتها مع إبطاء كفاءة العملية.
يحتفظ التعلم الآلي داخل قواعد البيانات بالبيانات في مكان واحد. يلغي هذا الحاجة إلى نقل البيانات، مما يقلل من التصدير/الاستيراد والمدخلات/المخرجات. نتيجة إلى ذلك، يمكن أن تحدث عمليات داخل البيئة الأصلية، دون الاعتماد على أنظمة أخرى. يؤدي ذلك إلى توفير أدوات وإمكانات الأتمتة لمُختلف المهام، مثل عمليات فحص النشر والتدقيق والصيانة. يمكن للمستخدمين الاستفادة من هذه الميزات دون القلق بشأن مشكلات التوافق أو التكامل التي قد تنشأ.
تأتي أدوات التعلم الآلي داخل قواعد البيانات في مجموعة مُتنوعة من الخدمات والإمكانات. في كثير من الحالات، تُشبه هذه الأدوات ما قد يوفره مورد قاعدة البيانات في كإمكانات مستقلة، إما في شكل مجموعة فرعية من الميزات المُتكاملة أو في شكل اتصال مُضمن بمنصة التعلم الآلي للمورد. على سبيل المثال، توفر Oracle Database إمكانات التعلم الآلي داخل البيئة للتخلص من الحاجة إلى نقل البيانات من نظام إلى نظام. في هذه الحالة، توفر Oracle Database الاستكشاف والإعداد والنمذجة باستخدام أدوات Oracle Machine Learning، مثل SQL وR وPython وREST والتعلم الآلي المؤتمت (AutoML) والواجهات دون تعليمات برمجية، إلى جانب مجموعة مُتنوعة من الخوارزميات المُتاحة.
على الرغم من أنه يأتي مع مزايا جذَّابة، إلا أن التعلم الآلي داخل قواعد البيانات يعتمد بشكل كبير على ميزات بيئة قاعدة البيانات وإمكاناتها. قد يؤدي هذا إلى مشكلات في الترحيل المستقبلي أو عندما يتطلب نموذج ML شيئًا يتجاوز الإمكانات الأصلية للبيئة.
تشمل العيوب والقيود الأكثر شيوعًا للتعلم الآلي داخل قواعد البيانات ما يلي:
إذا كان كل شيء يتوافق مع احتياجات التعلم الآلي للمشروع وأهدافه، فإن الانتقال من الاختبار إلى النشر هو في الواقع خطوة بسيطة. مع ذلك، تستند هذه النماذج إلى الإمكانات المُحددة للأدوات داخل قواعد البيانات الخاصة بالمؤسسة. ماذا يحدث عند تطور المشروع إلى شيء أكثر تعقيدًا أو يتطلب الترحيل؟ يمكن أن يجعل العمل باستخدام الأدوات داخل قواعد البيانات حمل عمل ML الفوري أسرع وأكفأ، لكن المستقبل يمكن أن يمثل علامة استفهام، لذلك من الضروري التفكير في إذا كانت الأهداف طويلة الأجل تتوافق مع الإمكانات الحالية أم لا.
لا يعمل التعلم الآلي داخل قواعد البيانات سوى على تطبيقات قاعدة البيانات المدعومة وقد يوفر مجموعة محدودة من واجهات برمجة التطبيقات. يتغير هذا مع نمو إمكانات أنظمة التعلم الآلي داخل قاعدة البيانات، لكن كقاعدة عامة، توفر الأدوات المُستقلة المزيد من القوة والميزات، إلى جانب مجموعة كبيرة من المتخصصين المتاحين لمساعدة الشركات في استغلال هذه الميزات.
تؤدي أكبر قوة للتعلم الآلي داخل قواعد البيانات أيضًا إلى واحدة من أكبر عيوبها ما يلي: من خلال الحفاظ على البيانات داخل بيئة قواعد البيانات، يتم تخطي خطوات ETL/ELT—لكن يعني ذلك تجاوز فرص التدقيق وتنقيح البيانات أيضًا.
في كثير من الحالات، لن تشترك قواعد البيانات في نفس موارد الحوسبة مثل أدوات التعلم الآلي، خاصةً بالنسبة إلى النماذج واسعة النطاق أو شديدة التعقيد التي تتطلب حوسبة عالية الأداء. لهذا السبب، يكون غالبًا لنطاق نماذج التعلم الآلي داخل قواعد البيانات حد أقصى. يختلف كل إعداد تنظيمي؛ وبالمثل تختلف احتياجات كل مشروع، وهذا مفاضلة يجب مراعاتها خلال مراحل التخطيط الأولية.
يوفِّر HeatWave الذكاء الاصطناعي المُؤتمت والمُتكامل والآمن والتعلم الآلي المؤتمت والمكون في خدمة سحابة واحدة للمعاملات والتحليلات التي تأتي على نطاق مستودع البيانات. يتضمن HeatWave AutoML كل ما يحتاجه المستخدمون لإنشاء نماذج ML والتدريب عليها وشرحها ضمن HeatWave دون أي تكلفة إضافية. باستخدام التعلم الآلي داخل قواعد البيانات في HeatWave، لن يحتاج العملاء إلى نقل البيانات إلى خدمة تعلم آلي مُنفصلة. يمكنك تطبيق تدريب التعلّم الآلي والاستنتاج والشرح بسهولة وأمان على البيانات المخزنة داخل MySQL وفي مخزن الكائنات. منصة HeatWave متوفرة على البنية التحتية من Oracle Cloud وAmazon Web Services وMicrosoft Azure.
للبدء، تحتاج المؤسسات إلى التأكد من أن قاعدة بياناتها توفر التعلم الآلي داخل قواعد البيانات، والذي يمكن أن يكون تغييرًا في قواعد البيانات للمؤسسات التي تتطلع إلى الاستفادة الكاملة من قوة التعلم الآلي. من خلال إدخال خوارزميات التعلم الآلي إلى البيانات، بدلاً من العكس، يكتسب صانعو القرار تحليلاً أسرع وأكفأ.
تأتي نماذج الذكاء الاصطناعي مع العديد من الأحجام ومستويات التعقيد، بدءًا من نماذج LLM إلى نماذج ML الأبسط. ما الذي يتشارك فيه الجميع؟ التعطش إلى البيانات. فيما يلي 4 مكونات للبنية التحتية للبيانات الجاهزة للذكاء الاصطناعي.
كيف يمكن استخدام التعلم الآلي داخل قواعد البيانات بفعالية؟
لا يعمل التعلم الآلي داخل قواعد البيانات سوى عندما تستخدم الشركات قاعدة بيانات تدعم الإمكانات داخل قاعدة البيانات. يجب مراعاة أساس قاعدة البيانات هذه لموارد الحوسبة، إلى جانب حجم قاعدة البيانات ونطاقها ونموذج التعلم الآلي.
ما مزايا منصات التعلم الآلي داخل قواعد البيانات؟
ينهي التعلم الآلي داخل قواعد البيانات الحاجة إلى استخراج البيانات ونقلها بين الأنظمة. ينشئ عن هذا مجموعة طبيعية من المزايا من جانب الكفاءة، وفي بعض الحالات، يمكن أن يُقلص أوقات العمليات من أسابيع إلى أيام لأنه يلغي الحاجة إلى الاعتماد على الأدوات الخارجية لـ ETL/ELT. من منظور شامل، يقلل هذا أيضًا من تكلفة الملكية ويزيد من قابلية التوسع والكفاءة التشغيلية من خلال استخدام موارد أقل.
ما هي بعض المشكلات التي يجب مراعاتها عند استخدام التعلم الآلي داخل قواعد البيانات؟
قبل اتخاذ قرار باستخدام التعلم الآلي داخل قواعد البيانات لمشروع، يجب على الفِرق تقييم العوامل التالية:
يمكن لهذه الأسئلة أن توضح إيجابيات التعلم الآلي داخل قواعد البيانات وسلبياتها ويجب النظر فيها لكل مشروع.
ما هي بعض الاتجاهات المستقبلية في ML داخل قواعد البيانات؟
يواصل موفرو الخدمة تحسين إمكاناتهم في التعلم الآلي داخل قواعد البيانات وتوسيعها، ويعني ذلك وجود عدد من الاتجاهات التي تلوح في الأفق. نظرًا إلى أن المزيد والمزيد من الأدوات والمنصات تدعم التعلم الآلي داخل قواعد البيانات، يتمكن علماء البيانات من إنشاء نماذج أكثر تعقيدًا ونشرها. يوفر هذا أيضًا شفافية أكبر لأن النموذج موجود على منصة موحدة بدلاً من الاقتصار على مَن يستخدم أدوات التعلم الآلي ويعززها. تعني الإمكانات الأكبر أيضًا قابلية الاستخدام مع مجموعات بيانات أكبر، وبالتالي؛ تدريب واختبار ونشر أسرع.