نعتذر عن عدم العثور على مطابقة لبحثكم.

نقترح أن تجرِّب ما يلي للمساعدة في العثور على ما تبحث عنه:

  • تحقق من تهجئة كلماتك الرئيسية التي تبحث عنها.
  • استخدم المرادفات للكلمة الرئيسية التي كتبتها، على سبيل المثال، جرِّب “تطبيق” بدلاً من “برنامج.”
  • ابدأ بحثًا جديدًا.
الاتصال بنا تسجيل الدخول إلى Oracle Cloud

ما هو علم البيانات؟

علم البيانات المحدد

يجمع علم البيانات بين مجالات متعددة، بما في ذلك الإحصاء، والأساليب العلمية، الذكاء الاصطناعي (AI)، وتحليل البيانات، لاستخراج قيمة من البيانات. يُطلق على أولئك الذين يمارسون علم البيانات اسم علماء البيانات، ودورهم جمع مجموعة من المهارات لتحليل البيانات التي تم جمعها من الويب والهواتف الذكية والعملاء وأجهزة الاستشعار ومصادر أخرى لاشتقاق رؤى قابلة للتنفيذ.

يشمل علم البيانات إعداد البيانات للتحليل، بما في ذلك تنقية البيانات وتجميعها ومعالجتها لإجراء تحليل متقدم للبيانات. يمكن لعلماء البيانات والتطبيقات التحليلية بعد ذلك مراجعة النتائج للكشف عن الأنماط وتمكين قادة الأعمال من استخلاص رؤى مستنيرة.

علم البيانات: مورد غير مستغل للتعلم الآلي

علم البيانات هو أحد أكثر المجالات إثارة في الوقت الحالي. لكن ما سبب أهميته الكبيرة؟

لأن الشركات تحوز كنزًا نفيسًا من البيانات. كلما عملت التكنولوجيا الحديثة على تمكين إنشاء وتخزين الكميات المتزايدة من المعلومات، زادت أحجام البيانات زيادة هائلة. وتشير التقديرات إلى أن 90 بالمائة من البيانات في العالم قد تم إنشاؤها في العامين الماضيين. على سبيل المثال، يقوم مستخدمو Facebook بتحميل 10 ملايين صورة كل ساعة.

لكن هذه البيانات غالبًا ما تكون موجودة في قواعد البيانات ومراكز البيانات، ومعظمها لم يمسها أحد.

يمكن أن تحقق ثروة البيانات التي يتم جمعها وتخزينها بواسطة هذه التقنيات فوائد تحويلية للمنظمات والمجتمعات في جميع أنحاء العالم - ولكن فقط إذا تمكنا من تفسيرها. وهنا يأتي دور علم البيانات.

يكشف علم البيانات عن الاتجاهات ويُنتج رؤى يمكن للشركات استخدامها لاتخاذ قرارات أفضل وإنشاء منتجات وخدمات أكثر ابتكارًا. ربما الأهم من ذلك، أنه يمكّن نماذج التعلم الآلي (ML) من التعلم من الكميات الهائلة من البيانات التي يتم تغذيتها لهم، بدلاً من الاعتماد بشكل أساسي على محللي الأعمال لمعرفة ما يمكنهم اكتشافه من البيانات.

تُعد البيانات الأساس المتين للابتكار، ولكن تأتي قيمتها من البيانات المعلوماتية التي يمكن للعلماء استخلاصها منها، ثم التصرف بناءً عليها.

ما الفرق بين علم البيانات والذكاء الاصطناعي والتعلم الآلي؟

لفهم علم البيانات بشكل أفضل - وكيف يمكنك الاستفادة منه - من المهم أيضًا معرفة المصطلحات الأخرى المتعلقة بالمجال، مثل الذكاء الاصطناعي (AI) والتعلم الآلي. ستجد غالبًا أن هذه المصطلحات تستخدم بالتبادل، ولكن توجد فروق دقيقة بينها.

وفيما يلي تفصيل بسيط:

  • الذكاء الاصطناعي يعني جعل الكمبيوتر يُحاكي السلوك البشري بطريقة ما.
  • علم البيانات هو مجموعة فرعية من الذكاء الاصطناعي، ويشير أكثر إلى المجالات المتداخلة للإحصاءات والأساليب العلمية وتحليل البيانات - وكلها تُستخدم لاستخراج المعنى والأفكار من البيانات..
  • التعلم الآلي فئة فرعية أخرى من الذكاء الاصطناعي، وتتكون من التقنيات التي تمكِّن أجهزة الكمبيوتر من فهم الأشياء من البيانات وتقديم تطبيقات الذكاء الاصطناعي.
    وللحصول على مقياس جيد، سنضع تعريفًا آخر.
  • التعلم العميق وهو فئة فرعية من التعلم الآلي تُمكِّن أجهزة الكمبيوتر من حل المشكلات الأكثر تعقيدًا.

كيف يعمل علم البيانات على تحويل الأعمال

تستخدم المؤسسات علم البيانات لتحويل البيانات إلى ميزة تنافسية من خلال تحسين المنتجات والخدمات. تشمل حالات استخدام علم البيانات والتعلم الآلي ما يلي:

  • تحديد خسارة العملاء من خلال تحليل البيانات المُجمعة من مراكز الاتصال، بحيث يمكن لقسم التسويق اتخاذ إجراءات للاحتفاظ بهم
  • تحسين الكفاءة من خلال تحليل أنماط حركة المرور وأحوال الطقس وعوامل أخرى، ومن ثم تستطيع شركات اللوجستيات تحسين سرعات التسليم وخفض التكاليف.
  • تحسين تشخيصات المرضى من خلال تحليل بيانات الفحوصات الطبية والأعراض المُبلغ عنها حتى يتمكن الأطباء من تشخيص الأمراض مبكرًا وعلاجها بكفاءة أكبر
  • تحسين سلسلة التوريد من خلال توقع متى ستتعطل المعدات
  • كشف الاحتيال في الخدمات المالية من خلال التعرف على السلوكيات المشبوهة والإجراءات الشاذة
  • تحسين المبيعات من خلال إنشاء توصيات للعملاء بناءً على عمليات الشراء السابقة

لقد أعطت شركات كثيرة أولوية لعلم البيانات وتستثمر فيه بكثافة. وفقًا لاستطلاع أجرته شركة Gartner لأكثر من 3000 من المديرين التنفيذيين للمعلومات، والذي صنف فيه المشاركون التحليلات والمعلومات المهنية كأفضل تقنيات مميزة لمؤسساتهم. يرى مديرو أقسام المعلومات (CIO) الذين شاركوا في الاستبيانات أن هذه التقنيات هي الأكثر إستراتيجية لشركاتهم، ويستثمرون وفقًا لذلك.

كيف يتم إجراء علم البيانات

تتسم عملية تحليل البيانات والعمل بمقتضاها بكونها عملية تكرارية أكثر منها خطية، ولكن هذه هي الطريقة التي تتدفق بها دورة حياة علم البيانات عادة لأحد مشروعات نمذجة البيانات:

التخطيط:  تحديد مشروع ومخرجاته المحتملة.

إنشاء نموذج بيانات:  غالبًا ما يستخدم علماء البيانات مجموعة متنوعة من المكتبات مفتوحة المصدر أو أدوات في قاعدة البيانات لبناء نماذج التعلم الآلي. سيريد المستخدمون في كثير من الأحيان أن تساعد واجهات برمجة التطبيقات على استيعاب البيانات، أو إنشاء ملفات تعريف البيانات وتصورها، أو هندسة الميزات. سيحتاجون إلى الأدوات المناسبة، فضلاً عن الوصول إلى البيانات المناسبة والموارد الأخرى، مثل قوة الحوسبة.

تقييم أحد النماذج:  يجب أن يحقق علماء البيانات نسبة عالية من الدقة لنماذجهم قبل أن يشعروا بالثقة في نشرها. سينشئ تقييم النموذج عادةً مجموعة شاملة من تصورات ومقاييس التقييم لقياس أداء النموذج وفق البيانات الجديدة، وكذلك ترتيبها بمرور الوقت لتمكين السلوك الأمثل في الإنتاج. يتجاوز تقييم النموذج الأداء الأولي ليأخذ في الاعتبار السلوك الأساسي المتوقع.

شرح أحد النماذج:  لم تكن القدرة على شرح الآليات الداخلية لنتائج نماذج التعلم الآلي من منظور إنساني ممكنة دائمًا - ولكنها تزداد أهمية. يريد علماء البيانات تفسيرات مؤتمتة لعوامل الترجيح النسبية وأهمية العوامل التي تدخل في إنشاء أي تنبؤ، وتفاصيل توضيحية خاصة بالنماذج بشأن تنبؤات النماذج.

نشر أحد النماذج:  غالبًا ما يكون أخذ نموذج تعلم آلي مدربًا وإدخاله في الأنظمة الصحيحة عملية صعبة وشاقة. يمكن تسهيل ذلك عن طريق تفعيل النماذج كواجهات برمجة تطبيقات قابلة للتوسع وآمنة، أو استخدام نماذج تعلم آلي في قاعدة البيانات.

مراقبة النماذج:  لسوء الحظ، فإن نشر النموذج ليس نهاية المطاف. يجب دائمًا مراقبة النماذج بعد النشر للتأكد من أنها تعمل بشكل صحيح. قد تصبح البيانات التي تم تدريب النموذج عليها ليست ذات صلة بالتنبؤات المستقبلية بعد فترة من الزمن. على سبيل المثال، في اكتشاف الاحتيال، يبتكر المجرمون دائمًا طرقًا جديدة لاختراق الحسابات.

الأدوات اللازمة لعلم البيانات

يمكن أن يكون بناء نماذج التعلم الآلي وتقييمها ونشرها ومراقبتها عملية معقدة. ولهذا السبب زاد عدد أدوات علم البيانات. يستخدم علماء البيانات أنواعًا عديدة من الأدوات، ولكن إحدى أكثر الأدوات شيوعًا هي أجهزة الكمبيوتر المحمولة مفتوحة المصدر، والتي تُعد تطبيقات ويب لكتابة التعليمات البرمجية وتشغيلها وتصور البيانات ورؤية النتائج، كل ذلك في نفس البيئة.

ومن بين دفاتر الملاحظات الأكثر شعبية Jupyter وRStudio وZeppelin. تُعد دفاتر الملاحظات مفيدة جدًا في إجراء التحليل، ولكن لها حدودها عندما يحتاج علماء البيانات إلى العمل كفريق واحد. لقد تم بناء الأنظمة الأساسية لعلم البيانات من أجل حل هذه المشكلة.

لتحديد أداة علم البيانات المناسبة لك، من المهم طرح الأسئلة التالية: ما نوع اللغات التي يستخدمها علماء البيانات لديك؟ ما نوع أساليب العمل التي يفضلونها؟ ما نوع مصادر البيانات التي يستخدمونها؟

على سبيل المثال، يفضل بعض المستخدمين الحصول على خدمة غير محددة مصادر البيانات تستخدم مكتبات مفتوحة المصدر. يفضل البعض الآخر سرعة خوارزميات التعلم الآلي في قاعدة البيانات.


من يشرف على عمليات علم البيانات؟

يشرف ثلاثة أنواع من المديرين على مشروعات علم البيانات عادة في معظم المؤسسات، وهم:

مديرو الشركات:  يعمل هؤلاء المديرون مع فريق علم البيانات لتحديد المشكلة وتطوير إستراتيجية للتحليل. وقد يكونون رأس إدارة ما أو تخصص، مثل التسويق أو التمويل أو المبيعات، ولديهم فريق علم بيانات يرفع تقاريره إليهم. ويعملون بشكل وثيق مع مديري تكنولوجيا المعلومات وعلم البيانات لضمان تسليم المشروعات.

مديرو تكنولوجيا المعلومات:  كبار مديري تكنولوجيا المعلومات مسؤولون عن البنية الأساسية والبنية التي ستدعم عمليات علوم البيانات. فهم يراقبون العمليات واستخدام الموارد باستمرار لضمان عمل فرق علم البيانات بكفاءة وأمان. وقد يتحملون أيضًا مسؤولية إنشاء بيئات تكنولوجيا معلومات لفرق علم البيانات وتحديثها.

مديرو علم البيانات:  يشرف هؤلاء المديرون على فريق علوم البيانات وعملهم اليومي. وهم بناة الفريق الذين يمكنهم الموازنة بين تطوير الفريق والتخطيط للمشروع ومراقبته.

لكن الشخص الأهم في هذه العملية هو عالم البيانات.

ما المقصود بعالم البيانات؟

كمجال اختصاص، يُعد علم البيانات علمًا جديدًا. فقد نشأ من مجالات التحليل الإحصائي والتنقيب عن البيانات. مجلة علوم البيانات ظهرت لأول مرة في عام 2002، ونشرها المجلس الدولي للعلوم: لجنة بيانات العلوم والتكنولوجيا. بحلول عام 2008، ظهر مصطلح علماء البيانات، وبدأ هذا المجال في الانطلاق. كان هناك نقص في علماء البيانات منذ ذلك الحين، حتى مع قيام المزيد والمزيد من الكليات والجامعات في البدء بتقديم شهادات علمية لعلم البيانات.

يمكن أن تشمل واجبات عالم البيانات تطوير إستراتيجيات لتحليل البيانات، وإعداد البيانات للتحليل والاستكشاف وتحليل الصور وتصور البيانات، وإنشاء نماذج مع البيانات باستخدام لغات برمجة، مثل Python وR، ونشر النماذج في التطبيقات.

لا يمكن لعالم البيانات أن يعمل منفردًا. وفي الواقع، علوم البيانات الأكثر فعالية هي التي تتم في الفرق. بالإضافة إلى عالم البيانات، قد تضم هذه الفرق محلل أعمال يُحدد المشكلة، ومهندس بيانات يقوم بإعداد البيانات وكيفية الوصول إليها، ومهندس تقنية معلومات يشرف على العمليات والبنية التحتية الأساسية، ومطور تطبيقات ينشر النماذج أو مخرجات التحليل في التطبيقات والمنتجات.

تحديات تنفيذ مشروعات علم البيانات

على الرغم من وعود علم البيانات والاستثمارات الضخمة في فرق علم البيانات، فإن العديد من الشركات لا تدرك القيمة الكاملة لبياناتها. وفي سباقهم لتوظيف المواهب وإنشاء برامج علم البيانات، عانت بعض الشركات من تدفقات عمل الفريق غير الفعالة، بسبب وجود أشخاص مختلفين يستخدمون أدوات وعمليات مختلفة لا تعمل بشكل جيد معًا. بدون إدارة مركزية أكثر انضباطًا، قد لا يرى التنفيذيون عائدًا كاملاً من استثماراتهم.

وتُمثل هذه البيئة الفوضوية الكثير من التحديات.

لا يستطيع علماء البيانات العمل بكفاءة. نظرًا لأنه يجب منح حق الوصول إلى البيانات من قِبل مسؤول تكنولوجيا المعلومات، فغالبًا ما ينتظر علماء البيانات وقتًا طويلاً للحصول على البيانات والموارد التي يحتاجون إلى تحليلها. بمجرد وصولهم، قد يقوم فريق علم البيانات بتحليل البيانات باستخدام أدوات مختلفة - وربما غير متوافقة. على سبيل المثال، قد يطور عالم نموذج باستخدام لغة R، ولكن التطبيق الذي سيُستخدم فيه هذا النموذج مكتوب بلغة مختلفة. وهذا هو السبب في أن الأمر قد يستغرق أسابيع أو ربما شهورًا، لنشر النماذج في التطبيقات المفيدة.

لا يستطيع مطورو التطبيقات الوصول إلى التعلم الآلي القابل للاستخدام. في بعض الأحيان، تكون نماذج التعلم الآلي التي يتلقاها المطورون غير جاهزة للنشر في التطبيقات. ونظرًا لأن نقاط الوصول قد تكون غير مرنة، فلا يمكن نشر النماذج في جميع السيناريوهات وتُترك عملية قابلية التوسع لمطور التطبيق.

يستغرق مسؤولو تكنولوجيا المعلومات الكثير من الوقت في الدعم. بسبب انتشار الأدوات مفتوحة المصدر، يمكن أن يكون لقسم تكنولوجيا المعلومات قائمة متزايدة النمو من الأدوات التي تحتاج إلى الدعم. على سبيل المثال، قد يستخدم عالم البيانات في مجال التسويق أدوات مختلفة عن عالم البيانات في مجال التمويل. كما أن الفرق قد يكون لديها أيضًا مهام سير عمل مختلفة، وهو ما يعني أنه يجب على قسم تكنولوجيا المعلومات إعادة إنشاء البيئات وتحديثها باستمرار.

تتم إزالة مديري الأعمال أيضًا من علم البيانات. لا يتم دائمًا دمج مهام سير عمل علوم البيانات في عمليات وأنظمة اتخاذ القرارات التجارية، مما يجعل من الصعب على مديري الأعمال التعاون عن علم مع علماء البيانات. وبدون تكامل أفضل، يجد مديرو الأعمال صعوبة في فهم السبب الذي يستغرقه الانتقال من النموذج الأولي إلى مرحلة الإنتاج، وغالبًا ما يكونون أقل احتمالاً لدعم الاستثمار في مشاريع يرون أنها بطيئة للغاية.

يوفر النظام الأساسي لعلم البيانات إمكانات جديدة

أدرك الكثير من الشركات أنه بدون نظام أساسي متكامل، كان مجهود علم البيانات غير فعّال وغير آمن ويصعب توسيع نطاقه. وأدى هذا الإدراك إلى تطوير أنظمة أساسية لعلم البيانات. هذه الأنظمة الأساسية هي محاور للبرامج تعمل حولها جميع أعمال علم البيانات. يعمل النظام الأساسي الجيد على تقليل الكثير من التحديات التي تواجه تنفيذ علم البيانات، ويساعد الشركات على تحويل بياناتها إلى رؤى بشكل أسرع وأكثر كفاءة.

بفضل وجود نظام أساسي للتعلم الآلي مركزي، يمكن لعلماء البيانات العمل في بيئة تعاونية باستخدام أدواتهم المفضلة مفتوحة المصدر، مع مزامنة جميع أعمالهم من خلال نظام تحكم في الإصدارات.

فوائد النظام الأساسي لعلم البيانات

يقلل النظام الأساسي لعلم البيانات التكرار ويحفِّز الابتكار من خلال تمكين الفرق من مشاركة التعليمات البرمجية والنتائج والتقارير. يزيل الاختناقات في تدفق العمل من خلال تبسيط الإدارة ودمج أفضل الممارسات.

تهدف أفضل الأنظمة الأساسية لعلم البيانات بوجه عام إلى:

  • جعل علماء البيانات أكثر إنتاجية من خلال مساعدتهم على تسريع وتيرة النماذج وتقديمها بشكل أسرع وبمعدل خطأ أقل
  • تيسير عمل علماء البيانات باستخدام كميات كبيرة من البيانات وأنواع مختلفة منها
  • تقديم ذكاء اصطناعي موثوق به وعلى مستوى المؤسسات خالٍ من التحيز وقابل للتدقيق وقابل للتكرار

تم إنشاء الأنظمة الأساسية لعلم البيانات كي يتعاون من خلالها مجموعة من المستخدمين بمن فيهم علماء بيانات الخبراء، وعلماء بيانات المواطنين، ومهندسي البيانات، ومهندسي أو متخصصي التعلم الآلي. على سبيل المثال، قد يسمح النظام الأساسي لعلم البيانات لعلماء البيانات بنشر النماذج كواجهات لبرمجة التطبيقات، مما يجعل من السهل دمجها في تطبيقات مختلفة. ويمكن لعلماء البيانات الوصول إلى الأدوات والبيانات والبنية التحتية دون الحاجة إلى انتظار قسم تكنولوجيا المعلومات.

لقد زادت الحاجة إلى الأنظمة الأساسية لعلوم البيانات في السوق. وفي الواقع، من المتوقع أن ينمو سوق الأنظمة الأساسية بمعدل سنوي مركب بأكثر من 39 بالمائة خلال السنوات القليلة المقبلة، ومن المتوقع أن يصل إلى 385 مليار دولار أمريكي بحلول عام 2025.

ما يحتاجه عالم بيانات في أي نظام أساسي

إذا كنت مستعدًا لاستكشاف إمكانات الأنظمة الأساسية لعلم البيانات، فإليك بعض الإمكانيات الأساسية التي يجب وضعها في الاعتبار:

اختيار واجهة مستخدم تستند إلى المشروعات تشجع على التعاون. يجب أن يعمل النظام الأساسي على تمكين الناس من العمل معًا على النماذج، بدءًا من التصور حتى مرحلة التطوير النهائية. كما يجب أن يمنح كل عضو في الفريق إمكانية الوصول إلى البيانات والموارد.

منح الأولوية للتكامل والمرونة. تأكد من أن النظام الأساسي يتضمن دعمًا لأحدث الأدوات مفتوحة المصدر، وموفري التحكم في الإصدارات الشائعة مثل GitHub وGitLab وBitbucket؛ والتكامل المحكم مع الموارد الأخرى.

تضمين قدرات على مستوى المؤسسات. تأكد من أن النظام الأساسي قادر على توسيع نطاق عملك مع نمو فريقك. حيث يجب أن يكون النظام الأساسي متاحًا بدرجة كبيرة وأن يكون لديه عناصر تحكم قوية في الوصول ويدعم عددًا كبيرًا من المستخدمين المتزامنين.

جعل علم البيانات كخدمة ذاتية مُحسنة. ابحث عن نظام أساسي يخفف من عبء تكنولوجيا المعلومات والعمليات الهندسية، ويسهل على علماء البيانات تسريع وتيرة دوران البيئات على الفور وتتبع جميع أعمالهم ونشر النماذج بسهولة في مرحلة الإنتاج.

ضمان نشر نماذج أسهل. يعد نشر النماذج وتفعيلها أحد أهم خطوات دورة حياة التعلم الآلي، ولكن غالبًا ما يتم تجاهله. تأكد من أن الخدمة التي تختارها تسهِّل تفعيل النماذج، سواء أكانت توفر واجهات برمجة التطبيقات أو تضمن بناء المستخدمين للنماذج بطريقة تسمح بالتكامل السهل.

عندما يكون النظام الأساسي لعلم البيانات الخطوة الصحيحة

قد تكون مؤسستك جاهزة لنظام أساسي لعلم البيانات، إذا لاحظت ما يلي:

  • تظهر علامات الإجهاد على الإنتاجية والتعاون
  • لا يمكن مراجعة نماذج التعلم الآلي أو إعادة إنتاجها
  • لا تدخل النماذج مرحلة الإنتاج أبدًا

يستطيع أي نظام أساسي لعلم البيانات تقديم قيمة حقيقية لأعمالك. يشمل النظام الأساسي لعلوم البيانات من Oracle مجموعة واسعة من الخدمات التي توفر تجربة شاملة ومتكاملة مصممة لتسريع نشر النموذج وتحسين نتائج علوم البيانات.