مايو 2 2022
ما المقصود بالتنقيب عن البيانات؟ ببساطة، إنها عملية اكتشاف الرؤى عند التعامل مع كميات كبيرة من البيانات. يمكن أن تأتي هذه البيانات من العديد من المصادر أو قاعدة بيانات واحدة، ويمكن إنشاء الرؤى من خلال الاكتشاف اليدوي أو الأتمتة. توجد العديد من المسارات المختلفة لإنتاج رؤى، ويعتمد ذلك غالبًا على المتغيرات، مثل الموارد وإمكانات التعلم الآلي/الذكاء الاصطناعي وتعقيد البيانات وحجم البيانات وتدريب الموظفين وخبراتهم. تتضمن هذه العملية تحليلاً عميقًا للبيانات لاكتشاف الأنماط والعوامل الأساسية، وكل ذلك لإنشاء استنتاجات واتخاذ قرارات مستنيرة.
ارتفع استخدام التنقيب عن البيانات بشكل كبير خلال السنوات العشرين الماضية، إذ وفرت المزيد من مصادر البيانات بيئة بيانات كبيرة. تشير البيانات الكبيرة إلى كميات هائلة من البيانات، وتكون غالبًا في تدفقات مستمرة من مصادر متعددة وبسرعة عالية. في الأيام الأولى من التحليل الذكي للأعمال، ما تم تصدير جداول البيانات غالبًا من الأجهزة وتم إعدادها يدويًا للوصول إلى رؤى. لكن مع تزايد اتصال العالم، يمكن أن تصل البيانات إلى أحجام هائلة للغاية للتحليل اليدوي، خاصةً عندما يتعلق الأمر بمزيج من كل من البيانات المُنظمة وغير المُنظمة.
تُعد عملية التنقيب عن البيانات عملية تجعل البيانات الكبيرة تعمل. دون التنقيب عن البيانات، تنتهي الشركات إلى وجود الكثير من تيرابايت من البيانات من مجموعة واسعة من المصادر: أجهزة إنترنت الأشياء (IoT)، وقواعد البيانات، والوسائط الاجتماعية للشركات، ورسائل البريد الإلكتروني التسويقية، وأجهزة الاستشعار، واستخدام الموقع، وأكثر من ذلك بكثير، لكل منها مجموعة خاصة به من البيانات الوصفية. يكون من المستحيل فعليًا دمج الكميات الكبيرة من البيانات. تستخدم تقنيات التنقيب عن البيانات خوارزميات لتحديد الأنماط من خلال هذه المجموعة الضخمة من السجلات، ثم إخراج مجموعة من التوصيات للفِرق للعمل عليها.
يأتي مثال بسيط على ذلك من التسوق عبر الإنترنت لتجار التجزئة. في هذه الحالات، يتم تجميع سجلات العملاء في قاعدة بيانات ضخمة. تمر الخوارزمية في تلك البيانات للبحث عن الارتباطات، على سبيل المثال الأشخاص الذين يشترون من علامة تجارية معينة فحسب طعام الكلاب. تبحث هذه الخوارزمية عن معلومات حول عمليات الشراء المرتبطة، مثل المكملات الغذائية أو العلامات التجارية للعناية بالبشرة. مع ظهور الأنماط، يمكن تغذية فريق التسويق بهذه المعلومات لإنشاء عروض ترويجية مرتبطة بهذه العلامة التجارية المحددة.
يشرح القسم أعلاه التنقيب عن البيانات على مستوى شامل، لكن دعونا نستكشف العملية الفعلية للتنقيب عن البيانات. يتم استخدام كل من المعالجة الآلية والتحليل البشري في تحقيق أقصى استفادة من التنقيب عن البيانات، مع قيام الموظفين بوضع المبادئ التوجيهية في حين أن التعلم الآلي والذكاء الاصطناعي يمران بكميات كبيرة من البيانات. بشكل عام، يتم استخدام سير العمل التالي:
بمجرد إنشاء نموذج التنقيب عن البيانات، يحين الوقت لنشره عبر مجموعات البيانات. تكون المراقبة النشطة مطلوبة لضمان عدم وجود أي مفاجآت أو أسباب لتعديل النموذج وتنقيحه. إذا كان كل شيء يعمل كما هو مُخطط له، فيجب أن توضح البيانات الناتجة معايير الصلاحية والفائدة، ونتيجة لذلك؛ تكون جاهزة لمستخدمي الأعمال للمراجعة لاتخاذ قرارات قائمة على البيانات.
بالإضافة إلى مثال البيع بالتجزئة أعلاه، فيمكن أن يكون التنقيب عن البيانات عملية تحويلية لعدد من الصناعات. توضح الأمثلة أدناه طريقة تطبيق التنقيب عن البيانات على الاحتياجات الخاصة بالصناعة.
يمكن للتنقيب عن البيانات تحويل صناعة الرعاية الصحية من خلال تحسين التجارب وتسريعها لكل من مقدمي الخدمات والمرضى. يمكن لمقدمي الخدمات استخدام التنقيب عن البيانات لتسريع البحث وتفاعله، وفهم البيانات التشغيلية لأفضل دعم لاحتياجات التوظيف، والتعرُّف على الإشارات التحذيرية للتأمين وتسجيل الاحتيال. بالنسبة إلى المرضى، يحدد التنقيب عن البيانات الأنماط التي تحفِّز خيارات الرعاية الوقائية، مما يضمن إمكانية بدء المحادثات قبل أن تكون العلاجات ضرورية. يمكنه أيضًا تحديد الأنماط الخفية في الأشياء، مثل الآثار الجانبية، وفتح الباب أمام شعور أفضل بطريقة تأثر العلاجات بحالة المريض المحددة والفريدة.
بالنسبة إلى مجال التصنيع، يتم إنشاء البيانات عبر العملية بأكملها: شراء المواد، والخدمات اللوجستية للتجميع، ومراقبة الجودة، وتواريخ الشحن، والمرتجعات بسبب عيوب التصنيع. يمكن للتنقيب عن البيانات فحص كل من الخطوات الفردية في العملية والصورة الأكبر. يمكّن هذا الفِرق من معالجة المشكلات في كل من العرض الكلي والجزئي.
على سبيل المثال، قد يحدد التنقيب عن البيانات أن أحد الموردين المعينين لديه أوقات شحن أطول لكنه يكشف عن عيوب إجمالية أقل، بحيث يمكن للمديرين تحديد إذا كان يستحق المخاطرة أم لا لأنه يمكن تنفيذ الخطوات بالتوازي للتخفيف من تأثير التأخيرات. من ناحية أخرى، يمكن أن يُظهر أيضًا أن أحد الموردين يُسلم باستمرار لكن ارتفاع معدل العيوب له تأثير أكبر على العملية. يمكن للتنقيب عن البيانات إنشاء هذه الروابط، بحيث تحسِّن القرارات من عملية التصنيع بأكملها بدلاً من أن تكون منعزلة عن غيرها.
يوفر التنقيب عن البيانات العديد من المزايا لمقدمي الخدمات المالية، سواء للعمليات الداخلية أو لتجربة العملاء. على صعيد العمليات، يمكن أن يؤثر التنقيب عن البيانات على كل شيء بدءًا من الموارد البشرية وحتى التسويق. على وجه التحديد بالنسبة إلى ذلك المجال، يمكن أن يقلل التنقيب عن البيانات من مخاطر تكنولوجيا المعلومات، إذ أن التوافر والأمان هما الأولوية القصوى لأي شيء ينطوي على الإدارة المالية.
على جانب العملاء، يوفر التنقيب عن البيانات عناصر واقية بالإضافة إلى تجربة أفضل للعملاء. يمكن أن يحدد التنقيب عن البيانات عبر أنماط المعاملات العناصر التي تبدو غير عادية حسب المنطقة الجغرافية أو الوقت من اليوم أو فئة الشراء أو كل هذه العناصر معًا. يمكن بعد ذلك إعادة توجيه النتائج إلى فِرق الاحتيال لمعرفة إذا كانت تتطلب المتابعة. بالنسبة إلى المستخدم النهائي، يمكن لأنماط التنقيب عن البيانات إنشاء محفزات تسويقية للعروض الترويجية المُتخصصة، مثل إعادة التمويل أو قروض HELOC.
يمكن لكل هيئة داخل شركة، بدءًا من العمليات الداخلية وحتى خدمة العملاء الاستفادة من التنقيب عن البيانات. يبدأ التنقيب عن البيانات بنجاح بوجود بنية تحتية قوية للاستفادة من مصادر بيانات مُتعددة وعالية السرعة. جرِّب البنية التحتية من Oracle Cloud مجانًا لمعرفة كيف تبني الأساس للتنقيب عن البيانات.