ما المقصود باستخراج البيانات؟

2 مايو 2022

تعريف استخراج البيانات

ما المقصود باستخراج البيانات؟ ببساطة، إنها عملية اكتشاف الرؤى عند التعامل مع كميات كبيرة من البيانات. يمكن أن تأتي هذه البيانات من العديد من المصادر أو قاعدة بيانات واحدة، ويمكن إنشاء الرؤى من خلال الاكتشاف اليدوي أو الأتمتة. توجد العديد من المسارات المختلفة لإنتاج رؤى، اعتمادًا غالبًا على المتغيرات، مثل الموارد وإمكانات التعلم الآلي/الذكاء الاصطناعي وتعقيد البيانات وحجم البيانات وتدريب الموظفين وخبراتهم. تتضمن هذه العملية تحليلاً عميقًا للبيانات لاكتشاف الأنماط والعوامل الأساسية، وكل ذلك لإنشاء استنتاجات وإصدار قرارات مستنيرة.

استخراج البيانات في البيانات الكبيرة

ارتفع استخدام استخراج البيانات بشكل كبير خلال السنوات العشرين الماضية حيث وفرت المزيد من مصادر البيانات بيئة بيانات كبيرة. تشير البيانات الكبيرة إلى كميات هائلة من البيانات، غالبًا في تدفقات مستمرة من مصادر متعددة وبسرعة عالية. في الأيام الأولى من التحليل الذكي للأعمال، غالبًا ما تم تصدير جداول البيانات من الأجهزة وإعدادها يدويًا للحصول على رؤى. لكن مع تزايد اتصال العالم، يمكن أن تصل البيانات إلى أحجام هائلة للغاية للتفصيل اليدوي، خاصةً عندما يتعلق الأمر بمزيج من كل من البيانات المنظمة وغير المنظمة.

تعد عملية استخراج البيانات عملية تجعل البيانات الكبيرة تعمل. بدون استخراج البيانات، ستنتهي الشركات إلى الجلوس على تيرابايت من البيانات من مجموعة واسعة من المصادر: أجهزة إنترنت الأشياء (IoT)، وقواعد البيانات، والوسائط الاجتماعية للشركات، ورسائل البريد الإلكتروني التسويقية، وأجهزة الاستشعار، واستخدام الموقع، وأكثر من ذلك بكثير، لكل منها مجموعة خاصة به من البيانات الوصفية. من المستحيل فعليًا الجمع بين الكميات الكبيرة من البيانات. تستخدم تقنيات استخراج البيانات خوارزميات لتحديد الأنماط من خلال هذه المجموعة الضخمة من السجلات، ثم إخراج مجموعة من التوصيات للفرق للعمل عليها.

مثال بسيط على ذلك يأتي من التسوق عبر الإنترنت لتجار التجزئة. في هذه الحالات، يتم تجميع تواريخ العملاء في قاعدة بيانات ضخمة. تنتقل الخوارزمية من خلال تلك البيانات للبحث عن الارتباطات، على سبيل المثال، الأشخاص الذين يشترون علامة تجارية معينة فقط من طعام الكلاب. تبحث هذه الخوارزمية عن معلومات حول عمليات الشراء المرتبطة، مثل المكملات الغذائية أو التعامل مع العلامات التجارية. ومع ظهور الأنماط، يمكن تغذية فريق التسويق بهذه المعلومات لإنشاء عروض ترويجية مرتبطة بهذه العلامة التجارية المحددة.

كيفية عمل استخراج البيانات

يشرح القسم أعلاه استخراج البيانات على مستوى الصورة الكبيرة، ولكن دعونا نستكشف العملية الفعلية لاستخراج البيانات. يتم استخدام كل من المعالجة الآلية والتحليل البشري في تحقيق أقصى استفادة من استخراج البيانات، مع قيام الموظفين بوضع المبادئ التوجيهية في حين أن التعلم الآلي والذكاء الاصطناعي يخترقان كميات كبيرة من البيانات. بشكل عام، يتم استخدام سير العمل التالي:

  1. الأهداف: ما هو الهدف من استخراج البيانات الخاصة بك؟ ويشكل إرساء ذلك بين جميع أصحاب المصلحة أهم جزء من العملية. إذا لم يتم تحديد الهدف بشكل واضح ومدروس، فقد يتعين إلغاء الجهد بأكمله وإعادة تشغيله.
  2. إعداد البيانات: يمكن أن يتضمن إعداد البيانات مجموعة واسعة من العمليات، بما في ذلك سحب مصادر البيانات وإنشاء تنسيقات وتنظيف مجموعات البيانات من الحالات الشاذة والضوضاء.
  3. بناء النموذج: سيقوم علماء البيانات بعد ذلك ببناء النموذج وتطويره وتدريبه من خلال التكرار. في كثير من الحالات، سيتم بناء نماذج متعددة واختبارها للعثور على المسار الأنسب للهدف. تتطلب عملية التقييم هذه نهجًا واسعًا للتحقق، مع تقنيات، مثل التحقق المتقاطع وتحليل منحنى خاصية تشغيل المستلم (ROC).

بمجرد إنشاء نموذج استخراج البيانات، حان الوقت لنشره عبر مجموعات البيانات. المراقبة النشطة مطلوبة لضمان عدم وجود أي مفاجآت أو أسباب لتعديل النموذج وصقله. إذا كان كل شيء يعمل كما هو مخطط له، فيجب أن توضح البيانات الناتجة معايير الصلاحية والفائدة، ونتيجة لذلك تكون جاهزة لمستخدمي الأعمال للمراجعة لاتخاذ قرارات قائمة على البيانات.

حالات الاستخدام في استخراج البيانات

بالإضافة إلى مثال البيع بالتجزئة أعلاه، يمكن أن يكون استخراج البيانات عملية تحويلية لعدد من الصناعات. توضح الأمثلة أدناه كيفية تطبيق استخراج البيانات على الاحتياجات الخاصة بالصناعة.

استخراج البيانات للرعاية الصحية

يمكن لاستخراج البيانات تحويل صناعة الرعاية الصحية من خلال تحسين التجارب وتسريعها لكل من مقدمي الخدمات والمرضى. يمكن للمزودين استخدام استخراج البيانات لتسريع البحث وإشراكه، وفهم البيانات التشغيلية لأفضل دعم لاحتياجات التوظيف، وتحديد العلامات الحمراء للتأمين وتسجيل الاحتيال. وبالنسبة للمرضى، يحدد استخراج البيانات الأنماط التي تحفز خيارات الرعاية الوقائية، مما يضمن إمكانية بدء المحادثات قبل أن تكون العلاجات ضرورية. ويمكنه أيضًا تحديد الأنماط الخفية في الأشياء، مثل الآثار الجانبية، وفتح الباب أمام شعور أفضل بكيفية تأثر العلاجات بحالة المريض المحددة والفريدة.


استخراج البيانات للتصنيع

بالنسبة لصناعة التصنيع، يتم إنشاء البيانات عبر العملية بأكملها: شراء المواد، ولوجستيات التجميع، ومراقبة الجودة، وتواريخ الشحن، والمرتجعات بسبب عيوب التصنيع. يمكن لاستخراج البيانات فحص كل من الخطوات الفردية في العملية والصورة الأكبر. وهذا يمكّن الفرق من معالجة المشكلات في كل من العرض الصغير والكلي.

على سبيل المثال، قد يحدد استخراج البيانات أن أحد موردي معينين لديه أوقات شحن أطول ولكنه يظهر عيوبًا إجمالية أقل، بحيث يمكن للمديرين تحديد المخاطر التي تستحقها لأنه يمكن تشغيل الخطوات بالتوازي للتخفيف من تأثير التأخيرات. من ناحية أخرى، يمكن أن تظهر أيضًا أن أحد البائعين يقدم خدمات باستمرار ولكن ينشئ ارتفاع معدل العيوب تأثيرًا أكبر على العملية. يمكن لاستخراج البيانات إنشاء هذه الاتصالات بحيث تعمل القرارات على تحسين عملية التصنيع بأكملها بدلاً من تصير منعزلة عن الخارج.


استخراج البيانات للخدمات المالية

يوفر استخراج البيانات العديد من المزايا لمقدمي الخدمات المالية، سواء للعمليات الداخلية أو لتجربة العملاء. على صعيد العمليات، يمكن أن يؤثر استخراج البيانات على كل شيء بدءًا من الموارد البشرية وحتى التسويق. وعلى وجه التحديد بالنسبة لهذه الصناعة، يمكن أن يقلل استخراج البيانات من مخاطر تكنولوجيا المعلومات، حيث أن التوافر والأمان هما الأولوية القصوى لأي شيء ينطوي على التمويل.

على جانب العملاء، يوفر استخراج البيانات عناصر واقية بالإضافة إلى تجربة أفضل للعملاء. يمكن أن يحدد استخراج البيانات عبر أنماط المعاملات العناصر التي تبدو غير عادية حسب المنطقة الجغرافية أو الوقت من اليوم أو فئة الشراء أو كل هذه العناصر معًا. يمكن بعد ذلك إعادة توجيه النتائج إلى فرق الاحتيال لمعرفة ما إذا كانت تتطلب المتابعة. بالنسبة للمستخدم النهائي، يمكن لأنماط استخراج البيانات إنشاء حوافز تسويقية للعروض الترويجية المتخصصة، مثل إعادة التمويل أو قروض HELOC.

استخراج البيانات للمؤسسة

يمكن لكل مؤسسة في الشركة، بدءًا من العمليات الداخلية وحتى خدمة العملاء، الاستفادة من استخراج البيانات. يبدأ استخراج البيانات بنجاح بوجود بنية تحتية قوية للاستفادة من مصادر بيانات متعددة وعالية السرعة. جرِّب Oracle Cloud Infrastructure مجانًا لمعرفة كيف تبني الأساس لاستخراج البيانات.