لا توجد نتائج

بحثك لم يطابق أي نتائج.

نقترح أن تجرِّب ما يلي للمساعدة في العثور على ما تبحث عنه:

  • تحقق من تهجئة كلماتك الرئيسية التي تبحث عنها.
  • استخدم المرادفات للكلمة الرئيسية التي كتبتها، على سبيل المثال، جرِّب “تطبيق” بدلاً من “برنامج.”
  • جرِّب إحدى عمليات البحث الشائعة الموضحة أدناه.
  • ابدأ بحثًا جديدًا.
الأسئلة الرائجة

ما هو علم البيانات؟

تعريف علم البيانات

يجمع علم البيانات بين مجالات متعددة تشمل الأمور الإحصائية والأساليب العلمية والذكاء الاصطناعي وتحليل البيانات لاستخراج القيمة مِن البيانات. يُطلق مصطلح علماء البيانات على مِن يمارسون علم البيانات، وهم يجمعون بين مجموعة مِن المهارات لتحليل البيانات المجمعة مِن الويب والهواتف الذكية والعملاء وأجهزة الاستشعار وغيرها مِن المصادر مِن أجل استخلاص رؤى قابلة للتطبيق.

يتألف علم البيانات مِن إعداد البيانات للتحليل، ويشمل ذلك التنقية والتجميع والمعالجة للبيانات مِن أجل إجراء تحليل بيانات متقدم. بعد ذلك يستطيع علماء التطبيقات التحليلية والبيانات مراجعة النتائج مِن أجل الكشف عن الأنماط وتمكين قادة الأعمال لكي يستخلصوا رؤى مستنيرة.

علم البيانات: مورد غير مستغل للتعلم الآلي

علم البيانات هو أحد أكثر المجالات إثارة في الوقت الحالي. لكن ما سبب أهميته الكبيرة؟

لأن الشركات تحوز كنزًا نفيسًا من البيانات. كلما عملت التكنولوجيا الحديثة على تمكين إنشاء وتخزين الكميات المتزايدة من المعلومات، زادت أحجام البيانات زيادة هائلة. وتشير التقديرات إلى أن 90 بالمائة من البيانات في العالم قد تم إنشاؤها في العامين الماضيين. على سبيل المثال، يقوم مستخدمو Facebook بتحميل 10 ملايين صورة كل ساعة.

لكن هذه البيانات لا تزال غالبًا في قواعد البيانات وبحيرات البيانات، ومعظمها لم يستفد منها أحد.

ويمكن لثروة البيانات التي يتم جمعها وتخزينها بواسطة هذه التقنيات تحقيق منافع تحويلية للمنظمات والمجتمعات في جميع أنحاء العالم—ولكن فقط إذا استطعنا تفسيرها. وهنا يأتي دور علم البيانات.

يكشف علم البيانات عن الاتجاهات ويُنتج رؤى يمكن للشركات استخدامها لاتخاذ قرارات أفضل وإنشاء منتجات وخدمات أكثر ابتكارًا. ولعل الأهم من ذلك، أنه يمكِّن نماذج التعلم الآلي (ML) من التعلم من الكميات الهائلة من البيانات التي يتم تغذيتها لها بدلاً من الاعتماد بشكل أساسي على محللي الأعمال لمعرفة ما يمكنهم اكتشافه من البيانات.

تُعد البيانات الأساس المتين للابتكار، ولكن تأتي قيمتها من البيانات المعلوماتية التي يمكن للعلماء استخلاصها منها، ثم التصرف بناءً عليها.

ما الفرق بين علم البيانات والذكاء الاصطناعي والتعلم الآلي؟

لفهم علم البيانات بشكل أفضل وكيف يمكنك تسخيره، من الأهمية أيضًا معرفة المصطلحات الأخرى المتعلقة بالمجال، مثل الذكاء الاصطناعي والتعلم الآلي. ستجد غالبًا أن هذه المصطلحات تستخدم بالتبادل، ولكن توجد فروق دقيقة بينها.

وفيما يلي تفصيل بسيط:

  • الذكاء الاصطناعي يعني جعل الكمبيوتر يُحاكي السلوك البشري بطريقة ما.
  • علم البيانات هو عبارة عن فئة فرعية من الذكاء الاصطناعي، وهو يشير أكثر إلى المجالات المتداخلة للإحصاءات والأساليب العلمية وتحليل البيانات‬‏‫ وتُستخدم جميعها لاستنباط المعاني والأفكار من البيانات.
  • التعلم الآلي فئة فرعية أخرى من الذكاء الاصطناعي، وتتكون من التقنيات التي تمكِّن أجهزة الكمبيوتر من فهم الأشياء من البيانات وتقديم تطبيقات الذكاء الاصطناعي.
    وللحصول على مقياس جيد، سنضع تعريفًا آخر.
  • التعلم العميق، وهو فئة فرعية من التعلم الآلي تُمكِّن أجهزة الكمبيوتر من حل المشكلات الأكثر تعقيدًا.

كيف يعمل علم البيانات على تحويل الأعمال

تستخدم المؤسسات علم البيانات لتحويل البيانات إلى ميزة تنافسية من خلال تحسين المنتجات والخدمات. تشمل حالات استخدام علم البيانات والتعلم الآلي ما يلي:

  • تحديد خسارة العملاء من خلال تحليل البيانات المُجمعة من مراكز الاتصال، بحيث يمكن لقسم التسويق اتخاذ إجراءات للاحتفاظ بهم
  • تحسين الكفاءة من خلال تحليل أنماط حركة المرور وأحوال الطقس وعوامل أخرى، ومن ثم تستطيع شركات اللوجستيات تحسين سرعات التسليم وخفض التكاليف.
  • تحسين تشخيصات المرضى من خلال تحليل بيانات الفحوصات الطبية والأعراض المُبلغ عنها حتى يتمكن الأطباء من تشخيص الأمراض مبكرًا وعلاجها بكفاءة أكبر
  • تحسين سلسلة التوريد من خلال توقع متى ستتعطل المعدات
  • كشف الاحتيال في الخدمات المالية من خلال التعرف على السلوكيات المشبوهة والإجراءات الشاذة
  • تحسين المبيعات من خلال إنشاء توصيات للعملاء بناءً على عمليات الشراء السابقة

لقد أعطت شركات كثيرة أولوية لعلم البيانات وتستثمر فيه بكثافة. في استبيان حديث لـ Gartner مع أكثر من 3000 رئيس قسم تقنية المعلومات، صنّف المشاركون التحليلات وذكاء الأعمال كأفضل تقنية مميزة لمؤسساتهم. يرى مديرو أقسام المعلومات (CIO) الذين شاركوا في الاستبيانات أن هذه التقنيات هي الأكثر إستراتيجية لشركاتهم، ويستثمرون وفقًا لذلك.

كيف يتم إجراء علم البيانات

تتسم عملية تحليل البيانات والعمل بمقتضاها بكونها عملية تكرارية أكثر منها خطية، ولكن هذه هي الطريقة التي تتدفق بها دورة حياة علم البيانات عادة لأحد مشروعات نمذجة البيانات:

التخطيط:  تحديد مشروع ومخرجاته المحتملة.

بناء نموذج بيانات:  يستخدم علماء البيانات غالبًا مجموعة متنوعة من المكتبات مفتوحة المصدر أو الأدوات في قاعدة البيانات لبناء نماذج التعلم الآلي. سيريد المستخدمون في كثير من الأحيان أن تساعد واجهات برمجة التطبيقات على استيعاب البيانات، أو إنشاء ملفات تعريف البيانات وتصورها، أو هندسة الميزات. سيحتاجون إلى الأدوات المناسبة، فضلاً عن الوصول إلى البيانات المناسبة والموارد الأخرى، مثل قوة الحوسبة.

تقييم نموذج : يجب أن يحقق علماء البيانات نسبة عالية من الدقة لنماذجهم قبل أن يشعروا بالثقة في نشرها. سينشئ تقييم النموذج عادةً مجموعة شاملة من تصورات ومقاييس التقييم لقياس أداء النموذج وفق البيانات الجديدة، وكذلك ترتيبها بمرور الوقت لتمكين السلوك الأمثل في الإنتاج. يتجاوز تقييم النموذج الأداء الأولي ليأخذ في الاعتبار السلوك الأساسي المتوقع.

شرح النماذج : لم تكن القدرة على شرح الآليات الداخلية لنتائج نماذج التعلم الآلي من منظور بشري ممكنة دائمًا لكنها تزداد أهمية. يريد علماء البيانات تفسيرات مؤتمتة لعوامل الترجيح النسبية وأهمية العوامل التي تدخل في إنشاء أي تنبؤ، وتفاصيل توضيحية خاصة بالنماذج بشأن تنبؤات النماذج.

نشر نموذج : غالبًا ما يكون أخذ نموذج تعلم آلي ومدرب وإدخاله في الأنظمة الصحيحة عملية صعبة ومرهقة. يمكن تسهيل ذلك عن طريق تفعيل النماذج كواجهات برمجة تطبيقات قابلة للتوسع وآمنة، أو استخدام نماذج تعلم آلي في قاعدة البيانات.

نماذج المراقبة : لسوء الحظ، لا يعتبر نشر نموذج نهاية المطاف. يجب دائمًا مراقبة النماذج بعد النشر للتأكد من أنها تعمل بشكل صحيح. قد تصبح البيانات التي تم تدريب النموذج عليها ليست ذات صلة بالتنبؤات المستقبلية بعد فترة من الزمن. على سبيل المثال، في اكتشاف الاحتيال، يبتكر المجرمون دائمًا طرقًا جديدة لاختراق الحسابات.

الأدوات اللازمة لعلم البيانات

يمكن أن يكون بناء نماذج التعلم الآلي وتقييمها ونشرها ومراقبتها عملية معقدة. ولهذا السبب زاد عدد أدوات علم البيانات. يستخدم علماء البيانات أنواعًا كثيرة من الأدوات، ولكن إحدى أكثر الأدوات شيوعًا هي دفاتر الملاحظات مفتوحة المصدر، والتي تُعد تطبيقات ويب لكتابة التعليمات البرمجية وتشغيلها وتصور البيانات ورؤية النتائج—كل ذلك في البيئة ذاتها.

ومن بين دفاتر الملاحظات الأكثر شعبية Jupyter وRStudio وZeppelin. تُعد دفاتر الملاحظات مفيدة جدًا في إجراء التحليل، ولكن لها حدودها عندما يحتاج علماء البيانات إلى العمل كفريق واحد. لقد تم بناء الأنظمة الأساسية لعلم البيانات من أجل حل هذه المشكلة.

لتحديد أداة علم البيانات المناسبة لك، من المهم طرح الأسئلة التالية: ما نوع اللغات التي يستخدمها علماء البيانات لديك؟ ما نوع أساليب العمل التي يفضلونها؟ ما نوع مصادر البيانات التي يستخدمونها؟

على سبيل المثال، يفضل بعض المستخدمين الحصول على خدمة غير محددة مصادر البيانات تستخدم مكتبات مفتوحة المصدر. يفضل البعض الآخر سرعة خوارزميات التعلم الآلي في قاعدة البيانات.


من يشرف على عمليات علم البيانات؟

يشرف ثلاثة أنواع مِن المديرين على مشروعات علم البيانات عادة في معظم المؤسسات، وهم:

مديرو الأعمال:  يعمل المديرون هؤلاء مع فريق علم البيانات على تحديد المشكلة ووضع إستراتيجية التحليل. وقد يكونون رأس إدارة ما أو تخصص، مثل التسويق أو التمويل أو المبيعات، ولديهم فريق علم بيانات يرفع تقاريره إليهم. ويعملون بشكل وثيق مع مديري تكنولوجيا المعلومات وعلم البيانات لضمان تسليم المشروعات.

مديرو تكنولوجيا المعلومات:  يتحمل كبار مديري تكنولوجيا المعلومات مسؤولية البنية التحتية والبنية التي ستدعم عمليات علم البيانات. فهم يراقبون العمليات واستخدام الموارد باستمرار لضمان عمل فرق علم البيانات بكفاءة وأمان. وقد يتحملون أيضًا مسؤولية إنشاء بيئات تكنولوجيا معلومات لفرق علم البيانات وتحديثها.

مديرو علم البيانات:  يشرف هؤلاء المديرون على فريق علوم البيانات وعلى عملهم اليومي. وهم بناة الفريق الذين يمكنهم الموازنة بين تطوير الفريق والتخطيط للمشروع ومراقبته.

لكن الشخص الأهم في هذه العملية هو عالم البيانات.

ما المقصود بعالم البيانات؟

كمجال اختصاص، يُعد علم البيانات علمًا جديدًا. فقد نشأ من مجالات التحليل الإحصائي والتنقيب عن البيانات. وقد نُشرت مجلة Data Science لأول مرة في عام 2002، بواسطة المجلس الدولي للعلوم: لجنة بيانات العلوم والتقنية. بحلول عام 2008، ظهر مصطلح علماء البيانات، وبدأ هذا المجال في الانطلاق. كان هناك نقص في علماء البيانات منذ ذلك الحين، حتى مع قيام المزيد والمزيد من الكليات والجامعات في البدء بتقديم شهادات علمية لعلم البيانات.

يمكن أن تشمل واجبات عالم البيانات تطوير إستراتيجيات لتحليل البيانات، وإعداد البيانات للتحليل والاستكشاف وتحليل الصور وتصور البيانات، وإنشاء نماذج مع البيانات باستخدام لغات برمجة، مثل Python وR، ونشر النماذج في التطبيقات.

لا يمكن لعالم البيانات أن يعمل منفردًا. وفي الواقع، علوم البيانات الأكثر فعالية هي التي تتم في الفرق. بالإضافة إلى عالم البيانات، قد تضم هذه الفرق محلل أعمال يُحدد المشكلة، ومهندس بيانات يقوم بإعداد البيانات وكيفية الوصول إليها، ومهندس تقنية معلومات يشرف على العمليات والبنية التحتية الأساسية، ومطور تطبيقات ينشر النماذج أو مخرجات التحليل في التطبيقات والمنتجات.

تحديات تنفيذ مشروعات علم البيانات

على الرغم من وعود علم البيانات والاستثمارات الضخمة في فرق علم البيانات، فإن العديد من الشركات لا تدرك القيمة الكاملة لبياناتها. وفي سباقهم لتوظيف المواهب وإنشاء برامج علم البيانات، عانت بعض الشركات من تدفقات عمل الفريق غير الفعالة، بسبب وجود أشخاص مختلفين يستخدمون أدوات وعمليات مختلفة لا تعمل بشكل جيد معًا. بدون إدارة مركزية أكثر انضباطًا، قد لا يرى التنفيذيون عائدًا كاملاً من استثماراتهم.

وتُمثل هذه البيئة الفوضوية الكثير من التحديات.

لا يستطيع علماء البيانات العمل بكفاءة.. نظرًا لأنه يجب منح حق الوصول إلى البيانات من قِبل مسؤول تكنولوجيا المعلومات، فغالبًا ما ينتظر علماء البيانات وقتًا طويلاً للحصول على البيانات والموارد التي يحتاجون إلى تحليلها. وبمجرد وصولهم، قد يقوم فريق علم البيانات بتحليل البيانات باستخدام أدوات مختلفة—وربما غير متوافقة. على سبيل المثال، قد يطور عالم نموذج باستخدام لغة R، ولكن التطبيق الذي سيُستخدم فيه هذا النموذج مكتوب بلغة مختلفة. وهذا هو السبب في أن الأمر قد يستغرق أسابيعًا أو ربما شهورًا لنشر النماذج في التطبيقات المفيدة.

لا يستطيع مطورو التطبيقات الوصول إلى التعلم الآلي القابل للاستخدام. في بعض الأحيان، تكون نماذج التعلم الآلي التي يتلقاها المطورون غير جاهزة للنشر في التطبيقات. ونظرًا لأن نقاط الوصول قد تكون غير مرنة، فلا يمكن نشر النماذج في جميع السيناريوهات وتُترك عملية قابلية التوسع لمطور التطبيق.

يستغرق مسؤولو تكنولوجيا المعلومات الكثير من الوقت في الدعم. بسبب انتشار الأدوات مفتوحة المصدر، يمكن أن يكون لقسم تكنولوجيا المعلومات قائمة متزايدة النمو من الأدوات التي تحتاج إلى الدعم. على سبيل المثال، قد يستخدم عالم البيانات في مجال التسويق أدوات مختلفة عن عالم البيانات في مجال التمويل. كما أن الفرق قد يكون لديها أيضًا مهام سير عمل مختلفة، وهو ما يعني أنه يجب على قسم تكنولوجيا المعلومات إعادة إنشاء البيئات وتحديثها باستمرار.

تتم إزالة مديري الأعمال أيضًا من علم البيانات. لا يتم دمج تدفقات عمل علوم البيانات في عمليات وأنظمة صنع القرار، مما يجعل من الصعب على مديري الأعمال التعاون عن علم مع علماء البيانات. وبدون تكامل أفضل، يجد مديرو الأعمال صعوبة في فهم السبب الذي يستغرقه الانتقال من النموذج الأولي إلى مرحلة الإنتاج، وغالبًا ما يكونون أقل احتمالاً لدعم الاستثمار في مشاريع يرون أنها بطيئة للغاية.

يوفر النظام الأساسي لعلم البيانات إمكانات جديدة

أدرك الكثير من الشركات أنه بدون نظام أساسي متكامل، كان مجهود علم البيانات غير فعّال وغير آمن ويصعب توسيع نطاقه. وأدى هذا الإدراك إلى تطوير أنظمة أساسية لعلم البيانات. هذه الأنظمة الأساسية هي محاور للبرامج تعمل حولها جميع أعمال علم البيانات. يعمل النظام الأساسي الجيد على تقليل الكثير من التحديات التي تواجه تنفيذ علم البيانات، ويساعد الشركات على تحويل بياناتها إلى رؤى بشكل أسرع وأكثر كفاءة.

بفضل وجود نظام أساسي للتعلم الآلي مركزي، يمكن لعلماء البيانات العمل في بيئة تعاونية باستخدام أدواتهم المفضلة مفتوحة المصدر، مع مزامنة جميع أعمالهم من خلال نظام تحكم في الإصدارات.

فوائد النظام الأساسي لعلم البيانات

يقلل النظام الأساسي لعلم البيانات التكرار ويحفِّز الابتكار من خلال تمكين الفرق من مشاركة التعليمات البرمجية والنتائج والتقارير. ويعمل على إزالة الاختناقات في تدفقات العمل من خلال تبسيط الإدارة ودمج أفضل الممارسات.

تهدف أفضل الأنظمة الأساسية لعلم البيانات بوجه عام إلى:

  • جعل علماء البيانات أكثر إنتاجية من خلال مساعدتهم على تسريع وتيرة النماذج وتقديمها بشكل أسرع وبمعدل خطأ أقل
  • تيسير عمل علماء البيانات باستخدام كميات كبيرة من البيانات وأنواع مختلفة منها
  • تقديم ذكاء اصطناعي موثوق به وعلى مستوى المؤسسات خالٍ من التحيز وقابل للتدقيق وقابل للتكرار

تم إنشاء الأنظمة الأساسية لعلم البيانات كي يتعاون من خلالها مجموعة من المستخدمين بمن فيهم علماء بيانات الخبراء، وعلماء بيانات المواطنين، ومهندسي البيانات، ومهندسي أو متخصصي التعلم الآلي. على سبيل المثال، قد يسمح النظام الأساسي لعلم البيانات لعلماء البيانات بنشر النماذج كواجهات لبرمجة التطبيقات، مما يجعل من السهل دمجها في تطبيقات مختلفة. ويمكن لعلماء البيانات الوصول إلى الأدوات والبيانات والبنية التحتية دون الحاجة إلى انتظار قسم تكنولوجيا المعلومات.

لقد زادت الحاجة إلى الأنظمة الأساسية لعلوم البيانات في السوق. وفي الواقع، من المتوقع أن ينمو سوق الأنظمة الأساسية بمعدل سنوي مركب بأكثر من 39 بالمائة خلال السنوات القليلة المقبلة، ومن المتوقع أن يصل إلى 385 مليار دولار أمريكي بحلول عام 2025.

ما يحتاجه عالم بيانات في أي نظام أساسي

إذا كنت مستعدًا لاستكشاف إمكانات الأنظمة الأساسية لعلم البيانات، فإليك بعض الإمكانيات الأساسية التي يجب وضعها في الاعتبار:

اختيار واجهة مستخدم تستند إلى المشروعات تشجع على التعاون. يجب أن يعمل النظام الأساسي على تمكين الناس من العمل معًا على النماذج، بدءًا من التصور حتى مرحلة التطوير النهائية. كما يجب أن يمنح كل عضو في الفريق إمكانية الوصول إلى البيانات والموارد.

منح الأولوية للتكامل والمرونة. تأكد من أن النظام الأساسي يتضمن دعمًا لأحدث الأدوات مفتوحة المصدر، وموفري التحكم في الإصدارات الشائعة مثل GitHub وGitLab وBitbucket؛ والتكامل المحكم مع الموارد الأخرى.

تضمين قدرات على مستوى المؤسسات. تأكد من أن النظام الأساسي قادر على توسيع نطاق عملك مع نمو فريقك. حيث يجب أن يكون النظام الأساسي متاحًا بدرجة كبيرة وأن يكون لديه عناصر تحكم قوية في الوصول ويدعم عددًا كبيرًا من المستخدمين المتزامنين.

جعل علم البيانات كخدمة ذاتية مُحسنة. ابحث عن نظام أساسي يخفف من عبء تكنولوجيا المعلومات والعمليات الهندسية، ويسهل على علماء البيانات تسريع وتيرة دوران البيئات على الفور وتتبع جميع أعمالهم ونشر النماذج بسهولة في مرحلة الإنتاج.

ضمان نشر نماذج أسهل. يعد نشر النماذج وتفعيلها أحد أهم خطوات دورة حياة التعلم الآلي، ولكن غالبًا ما يتم تجاهله. تأكد من أن الخدمة التي تختارها تسهِّل تفعيل النماذج، سواء أكانت توفر واجهات برمجة التطبيقات أو تضمن بناء المستخدمين للنماذج بطريقة تسمح بالتكامل السهل.

عندما يكون النظام الأساسي لعلم البيانات الخطوة الصحيحة

قد تكون مؤسستك جاهزة لنظام أساسي لعلم البيانات، إذا لاحظت ما يلي:

  • تظهر علامات الإجهاد على الإنتاجية والتعاون
  • لا يمكن مراجعة نماذج التعلم الآلي أو إعادة إنتاجها
  • لا تدخل النماذج مرحلة الإنتاج أبدًا.

يستطيع أي نظام أساسي لعلم البيانات تقديم قيمة حقيقية لأعمالك. يشمل النظام الأساسي لعلم البيانات من Oracle مجموعة واسعة من الخدمات التي تقدم تجربة شاملة ومتكاملة مصممة لتسريع وتيرة نشر النماذج وتحسين نتائج علم البيانات.