بحثك لم يطابق أي نتائج.
نقترح أن تجرِّب ما يلي للمساعدة في العثور على ما تبحث عنه:
فيما يلي تعريف بسيط لعلم البيانات:
يجمع علم البيانات بين مجالات متعددة تشمل الأمور الإحصائية والأساليب العلمية وتحليل البيانات لاستخراج القيمة من البيانات.
يُطلق مصطلح علماء البيانات على من يمارسون علم البيانات، وهم يجمعون بين مجموعة من المهارات لتحليل البيانات المجمعة من الويب والهواتف الذكية والعملاء وأجهزة الاستشعار وغيرها من المصادر.
علم البيانات هو أحد أكثر المجالات إثارة في الوقت الحالي. لكن ما سبب أهميته الكبيرة؟
لأن الشركات تحوز كنزًا نفيسًا من البيانات. كلما عملت التكنولوجيا الحديثة على تمكين إنشاء وتخزين الكميات المتزايدة من المعلومات، زادت أحجام البيانات زيادة هائلة. وتشير التقديرات إلى أن 90 بالمائة من البيانات في العالم قد تم إنشاؤها في العامين الماضيين. على سبيل المثال، يقوم مستخدمو Facebook بتحميل 10 ملايين صورة كل ساعة.
لكن هذه البيانات لا تزال غالبًا في قواعد البيانات وبحيرات البيانات، ومعظمها لم يستفد منها أحد.
ويمكن لثروة البيانات التي يتم جمعها وتخزينها بواسطة هذه التقنيات تحقيق منافع تحويلية للمنظمات والمجتمعات في جميع أنحاء العالم—ولكن فقط إذا استطعنا تفسيرها. وهنا يأتي دور علم البيانات.
يكشف علم البيانات عن الاتجاهات ويُنتج رؤى يمكن للشركات استخدامها لاتخاذ قرارات أفضل وإنشاء منتجات وخدمات أكثر ابتكارًا. ولعل الأهم من ذلك، أنه يمكِّن نماذج التعلم الآلي (ML) من التعلم من الكميات الهائلة من البيانات التي يتم تغذيتها لها بدلاً من الاعتماد بشكل أساسي على محللي الأعمال لمعرفة ما يمكنهم اكتشافه من البيانات.
تُعد البيانات الأساس المتين للابتكار، ولكن تأتي قيمتها من البيانات المعلوماتية التي يمكن للعلماء استخلاصها منها، ثم التصرف بناءً عليها.
لفهم علم البيانات بشكل أفضل—وكيف يمكنك تسخيره—من الأهمية أيضًا معرفة المصطلحات الأخرى المتعلقة بالمجال، مثل الذكاء الاصطناعي والتعلم الآلي. ستجد غالبًا أن هذه المصطلحات تستخدم بالتبادل، ولكن توجد فروق دقيقة بينها.
وفيما يلي تفصيل بسيط:
وللحصول على مقياس جيد، سنضع تعريفًا آخر:
تستخدم المؤسسات علم البيانات لتحويل البيانات إلى ميزة تنافسية من خلال تحسين المنتجات والخدمات. تشمل حالات استخدام علم البيانات والتعلم الآلي ما يلي:
لقد أعطت شركات كثيرة أولوية لعلم البيانات وتستثمر فيه بكثافة. وفقًا لاستطلاع أجرته شركة Gartner لأكثر من 3000 من المديرين التنفيذيين للمعلومات، والذي صنف فيه المشاركون التحليلات والمعلومات المهنية كأفضل تقنيات مميزة لمؤسساتهم. يرى مديرو أقسام المعلومات (CIO) الذين شاركوا في الاستبيانات أن هذه التقنيات هي الأكثر إستراتيجية لشركاتهم، ويستثمرون وفقًا لذلك.
تتسم عملية تحليل البيانات والعمل بمقتضاها بكونها عملية تكرارية أكثر منها خطية، ولكن هذه هي الطريقة التي تتدفق بها دورة حياة علم البيانات عادة لأحد مشروعات نمذجة البيانات:
يمكن أن يكون بناء نماذج التعلم الآلي وتقييمها ونشرها ومراقبتها عملية معقدة. ولهذا السبب زاد عدد أدوات علم البيانات. يستخدم علماء البيانات أنواعًا كثيرة من الأدوات، ولكن إحدى أكثر الأدوات شيوعًا هي دفاتر الملاحظات مفتوحة المصدر، والتي تُعد تطبيقات ويب لكتابة التعليمات البرمجية وتشغيلها وتصور البيانات ورؤية النتائج—كل ذلك في البيئة ذاتها.
ومن بين دفاتر الملاحظات الأكثر شعبية Jupyter وRStudio وZeppelin. تُعد دفاتر الملاحظات مفيدة جدًا في إجراء التحليل، ولكن لها حدودها عندما يحتاج علماء البيانات إلى العمل كفريق واحد. لقد تم بناء الأنظمة الأساسية لعلم البيانات من أجل حل هذه المشكلة.
لتحديد أداة علم البيانات المناسبة لك، من المهم طرح الأسئلة التالية: ما نوع اللغات التي يستخدمها علماء البيانات لديك؟ ما نوع أساليب العمل التي يفضلونها؟ ما نوع مصادر البيانات التي يستخدمونها؟
على سبيل المثال، يفضل بعض المستخدمين الحصول على خدمة غير محددة مصادر البيانات تستخدم مكتبات مفتوحة المصدر. يفضل البعض الآخر سرعة خوارزميات التعلم الآلي في قاعدة البيانات.
يشرف ثلاثة أنواع من المديرين على مشروعات علم البيانات عادة في معظم المؤسسات، وهم:
لكن الشخص الأهم في هذه العملية هو عالم البيانات.
كمجال اختصاص، يُعد علم البيانات علمًا جديدًا. فقد نشأ من مجالات التحليل الإحصائي والتنقيب عن البيانات. وقد نُشرت مجلة Data Science لأول مرة في عام 2002، بواسطة المجلس الدولي للعلوم: لجنة بيانات العلوم والتقنية. بحلول عام 2008، ظهر مصطلح علماء البيانات، وبدأ هذا المجال في الانطلاق. كان هناك نقص في علماء البيانات منذ ذلك الحين، حتى مع قيام المزيد والمزيد من الكليات والجامعات في البدء بتقديم شهادات علمية لعلم البيانات.
يمكن أن تشمل واجبات عالم البيانات تطوير إستراتيجيات لتحليل البيانات، وإعداد البيانات للتحليل والاستكشاف وتحليل الصور وتصور البيانات، وإنشاء نماذج مع البيانات باستخدام لغات برمجة، مثل Python وR، ونشر النماذج في التطبيقات.
لا يمكن لعالم البيانات أن يعمل منفردًا. وفي الواقع، علوم البيانات الأكثر فعالية هي التي تتم في الفرق. بالإضافة إلى عالم البيانات، قد تضم هذه الفرق محلل أعمال يُحدد المشكلة، ومهندس بيانات يقوم بإعداد البيانات وكيفية الوصول إليها، ومهندس تقنية معلومات يشرف على العمليات والبنية التحتية الأساسية، ومطور تطبيقات ينشر النماذج أو مخرجات التحليل في التطبيقات والمنتجات.
على الرغم من وعود علم البيانات والاستثمارات الضخمة في فرق علم البيانات، فإن العديد من الشركات لا تدرك القيمة الكاملة لبياناتها. وفي سباقهم لتوظيف المواهب وإنشاء برامج علم البيانات، عانت بعض الشركات من تدفقات عمل الفريق غير الفعالة، بسبب وجود أشخاص مختلفين يستخدمون أدوات وعمليات مختلفة لا تعمل بشكل جيد معًا. بدون إدارة مركزية أكثر انضباطًا، قد لا يرى التنفيذيون عائدًا كاملاً من استثماراتهم.
وتُمثل هذه البيئة الفوضوية الكثير من التحديات.
لا يستطيع علماء البيانات العمل بكفاءة. نظرًا لأنه يجب منح حق الوصول إلى البيانات من قِبل مسؤول تكنولوجيا المعلومات، فغالبًا ما ينتظر علماء البيانات وقتًا طويلاً للحصول على البيانات والموارد التي يحتاجون إلى تحليلها. وبمجرد وصولهم، قد يقوم فريق علم البيانات بتحليل البيانات باستخدام أدوات مختلفة—وربما غير متوافقة. على سبيل المثال، قد يطور عالم نموذج باستخدام لغة R، ولكن التطبيق الذي سيُستخدم فيه هذا النموذج مكتوب بلغة مختلفة. وهذا هو السبب في أن الأمر قد يستغرق أسابيعًا—أو ربما شهورًا—لنشر النماذج في التطبيقات المفيدة.
لا يستطيع مطورو التطبيقات الوصول إلى التعلم الآلي القابل للاستخدام. في بعض الأحيان، تكون نماذج التعلم الآلي التي يتلقاها المطورون غير جاهزة للنشر في التطبيقات. ونظرًا لأن نقاط الوصول قد تكون غير مرنة، فلا يمكن نشر النماذج في جميع السيناريوهات وتُترك عملية قابلية التوسع لمطور التطبيق.
يستغرق مسؤولو تكنولوجيا المعلومات الكثير من الوقت في الدعم. بسبب انتشار الأدوات مفتوحة المصدر، يمكن أن يكون لقسم تكنولوجيا المعلومات قائمة متزايدة النمو من الأدوات التي تحتاج إلى الدعم. على سبيل المثال، قد يستخدم عالم البيانات في مجال التسويق أدوات مختلفة عن عالم البيانات في مجال التمويل. كما أن الفرق قد يكون لديها أيضًا مهام سير عمل مختلفة، وهو ما يعني أنه يجب على قسم تكنولوجيا المعلومات إعادة إنشاء البيئات وتحديثها باستمرار.
تتم إزالة مديري الأعمال أيضًا من علم البيانات. لا يتم دمج تدفقات عمل علوم البيانات في عمليات وأنظمة صنع القرار، مما يجعل من الصعب على مديري الأعمال التعاون عن علم مع علماء البيانات. وبدون تكامل أفضل، يجد مديرو الأعمال صعوبة في فهم سبب استغراق الانتقال من النموذج الأولي إلى مرحلة الإنتاج وقتًا طويلاً—وغالبًا ما يكونون أقل احتمالاً لدعم الاستثمار في مشاريع يرون أنها بطيئة جدًا.
أدرك الكثير من الشركات أنه بدون نظام أساسي متكامل، كان مجهود علم البيانات غير فعّال وغير آمن ويصعب توسيع نطاقه. وأدى هذا الإدراك إلى تطوير أنظمة أساسية لعلم البيانات. هذه الأنظمة الأساسية هي محاور للبرامج تعمل حولها جميع أعمال علم البيانات. يعمل النظام الأساسي الجيد على تقليل الكثير من التحديات التي تواجه تنفيذ علم البيانات، ويساعد الشركات على تحويل بياناتها إلى رؤى بشكل أسرع وأكثر كفاءة.
بفضل وجود نظام أساسي للتعلم الآلي مركزي، يمكن لعلماء البيانات العمل في بيئة تعاونية باستخدام أدواتهم المفضلة مفتوحة المصدر، مع مزامنة جميع أعمالهم من خلال نظام تحكم في الإصدارات.
يقلل النظام الأساسي لعلم البيانات التكرار ويحفِّز الابتكار من خلال تمكين الفرق من مشاركة التعليمات البرمجية والنتائج والتقارير. ويعمل على إزالة الاختناقات في تدفقات العمل من خلال تبسيط الإدارة ودمج أفضل الممارسات.
تهدف أفضل الأنظمة الأساسية لعلم البيانات بوجه عام إلى:
تم إنشاء الأنظمة الأساسية لعلم البيانات كي يتعاون من خلالها مجموعة من المستخدمين بمن فيهم علماء بيانات الخبراء، وعلماء بيانات المواطنين، ومهندسي البيانات، ومهندسي أو متخصصي التعلم الآلي. على سبيل المثال، قد يسمح النظام الأساسي لعلم البيانات لعلماء البيانات بنشر النماذج كواجهات لبرمجة التطبيقات، مما يجعل من السهل دمجها في تطبيقات مختلفة. ويمكن لعلماء البيانات الوصول إلى الأدوات والبيانات والبنية التحتية دون الحاجة إلى انتظار قسم تكنولوجيا المعلومات.
لقد زادت الحاجة إلى الأنظمة الأساسية لعلوم البيانات في السوق. وفي الواقع، من المتوقع أن ينمو سوق الأنظمة الأساسية بمعدل سنوي مركب بأكثر من 39 بالمائة خلال السنوات القليلة المقبلة، ومن المتوقع أن يصل إلى 385 مليار دولار أمريكي بحلول عام 2025.
إذا كنت مستعدًا لاستكشاف إمكانات الأنظمة الأساسية لعلم البيانات، فإليك بعض الإمكانيات الأساسية التي يجب وضعها في الاعتبار:
قد تكون مؤسستك جاهزة لنظام أساسي لعلم البيانات، إذا لاحظت ما يلي:
يستطيع أي نظام أساسي لعلم البيانات تقديم قيمة حقيقية لأعمالك. يشمل النظام الأساسي لعلم البيانات من Oracle مجموعة واسعة من الخدمات التي تقدم تجربة شاملة ومتكاملة مصممة لتسريع وتيرة نشر النماذج وتحسين نتائج علم البيانات.