No results found

Your search did not match any results.

We suggest you try the following to help find what you're looking for:

  • Check the spelling of your keyword search.
  • Use synonyms for the keyword you typed, for example, try “application” instead of “software.”
  • Try one of the popular searches shown below.
  • Start a new search.
Contact Us Sign in to Oracle Cloud

ما المقصود بالبيانات الكبيرة؟

البيانات الكبيرة المحددة

ما المقصود بالبيانات الكبيرة بالتحديد؟

تُعرَّف البيانات الكبيرة بأنها البيانات التي تحتوي على تنوع أكبر، وتصل إلى أحجام متزايدة وبسرعة أكبر. كما يُعرف هذا أيضًا باسم الثلاثة مقابل

ببساطة، البيانات الكبيرة عبارة عن مجموعات بيانات كبيرة ومعقدة للغاية، بالأخص من مصادر البيانات الجديدة. وتكون مجموعات البيانات هذه ضخمة للغاية لدرجة أن برامج معالجة البيانات العادية لا يمكنها إدارتها. ولكن يُمكِن استخدام هذا القدر الهائل من البيانات لمعالجة مشكلات العمل التي لم يكن بإمكانك معالجتها من قبل.

الثلاثة مقارنة بالبيانات الكبيرة

الحجم يعد مقدار البيانات مهمًا. باستخدام البيانات الكبيرة، سيلزمك معالجة كميات كبيرة من البيانات ذات الكثافة المنخفضة وغير المنظمة. قد تكون هذه عبارة عن بيانات لها قيمة غير معروفة، مثل موجز بيانات Twitter أو معدل النقر على صفحة ويب أو تطبيق جوَّال أو جهاز مزود بمستشعر. بالنسبة لبعض المؤسسات، يمكن أن تكون هذه في صورة عشرات من وحدات التيرابايت من البيانات. بالنسبة للبعض الآخر، قد تكون عبارة عن مئات من وحدات البيتابايت.
السرعة تتمثل السرعة في سرعة تلقي البيانات و(ربما) التصرف بناءً على هذه البيانات. في الظروف العادية، تتدفق السرعة الأعلى للبيانات مباشرة إلى الذاكرة مقابل الكتابة على القرص. تعمل بعض المنتجات الذكية الداعمة للإنترنت في الوقت الحقيقي أو قريبًا من الوقت الحقيقي وتحتاج إلى التقييم والعمل في الوقت الحقيقي.
التنوع يشير التنوع إلى العديد من أنواع البيانات المتاحة. تم تنظيم أنواع البيانات التقليدية وضبط تناسبها بدقة في قاعدة بيانات ارتباطية. مع بدء ظهور البيانات الكبيرة، تأتي البيانات في أنواع جديدة من البيانات غير المنظمة. تحتاج أنواع البيانات غير المنظمة وشبه المنظمة، مثل النصوص والصوت والفيديو، إلى معالجة إضافية مسبقة لاشتقاق المعنى ودعم البيانات الوصفية.

قيمة البيانات الكبيرة وحقيقتها——

ظهر عنصري مقارنة آخرين خلال السنوات القليلة الماضية: القيمة والموثوقية. تتميز البيانات بأن لها قيمة جوهرية. ولكنها عديمة الفائدة حتى يتم اكتشاف هذه القيمة. نفس القدر من الأهمية: ما مدى صدق بياناتك وإلى أي مدى يمكنك الاعتماد عليها؟

في الوقت الحالي، أصبحت البيانات الكبيرة بمثابة رأس المال. فكِّر في مجموعة من أكبر شركات التكنولوجيا في العالم. يتحقق جزء كبير من القيمة التي تقدمها هذه الشركات من خلال البيانات الخاصة بها، والتي تعيد الشركات تحليلها باستمرار للحصول على المزيد من الكفاءة وتطوير منتجات جديدة.

أدت التطورات التقنية الحديثة إلى خفض تكلفة تخزين البيانات والحوسبة إلى حد كبير، مما يزيد من سهولة تخزين المزيد من البيانات ويجعلها أقل تكلفة مقارنة بأي وقت مضى. مع زيادة حجم البيانات الكبيرة في الوقت الحالي التي أصبحت أرخص ويمكن الوصول إليها بصورة أسهل، يمكنك اتخاذ قرارات أعمال أكثر دقة وإحكامًا.

إن العثور على قيمة في البيانات الكبيرة لا يتعلق فقط بتحليلها (وهي تمثل فائدة أخرى كاملة). إنها عملية اكتشاف كاملة تحتاج إلى محللين يتميزون بالبصيرة ومستخدمي أعمال ومديرين تنفيذيين يطرحون الأسئلة الصحيحة ويتعرفون على الأنماط ويقدمون افتراضات مستنيرة ويتوقعون السلوك.

كيف نصل إلى هذا المستوى؟

تاريخ البيانات الكبيرة

على الرغم من أن مفهوم البيانات الكبيرة نفسه جديد نسبيًا، إلا أن أصول مجموعات البيانات الكبيرة ترجع إلى فترة الستينيات والسبعينيات من القرن التاسع عشر عندما كان عَالم البيانات قد بدأ للتو من خلال مراكز البيانات الأولى وتطوير قاعدة البيانات الارتباطية.

في عام 2005 تقريبًا، بدأ الأشخاص في إدراك مقدار البيانات التي ينشؤها المستخدمون من خلال Facebook وYouTube وغيرهما من الخدمات المتاحة عبر الإنترنت. تم تطوير Hadoop (إطار عمل مفتوح المصدر تم إنشاؤه على نحو خاص لتخزين مجموعات البيانات الكبيرة وتحليلها) في العام نفسه. بدأت NoSQL أيضًا في تحقيق شعبية خلال هذه الفترة.

كان تطوير أطر العمل مفتوحة المصدر، مثل Hadoop (وSpark في الفترة الأخيرة) ضروريًا لنمو البيانات الكبيرة لأنها تجعل العمل باستخدام البيانات الكبيرة أكثر سهولة وأرخص من حيث التخزين. في السنوات التي تلت تلك الفترة، ارتفع حجم البيانات الكبيرة بشدة. لا يزال المستخدمون ينشؤون كميات هائلة من البيانات، ولكن الأمر لا يقتصر على البشر فحسب.

فمع ظهور إنترنت الأشياء (IoT)، يتم ربط المزيد من الكائنات والأجهزة بالإنترنت، ويتم جمع البيانات بشأن أنماط استخدام العملاء وأداء المنتجات. لقد أدى ظهور التعلم الآلي إلى إنتاج المزيد من البيانات.

على الرغم من أن البيانات الكبيرة قد قطعت شوطًا طويلاً، إلا أن فائدتها لم تبدأ سوى الآن. عملت الحوسبة السحابية على توسيع البيانات الكبيرة إلى مستوى أبعد من ذلك. توفر السحابة قابلية توسع مرنة بصورة حقيقية، حيث يمكن من خلالها للمطورين ببساطة إنشاء مجموعات مخصصة لاختبار مجموعة فرعية من البيانات. كما أصبحت قواعد بيانات الرسوم البيانية ذات أهمية متزايدة أيضًا، وذلك بفضل قدرتها على عرض كميات هائلة من البيانات بطريقة تجعل التحليلات تتسم بالسرعة والشمولية.


فوائد البيانات الكبيرة:

  • تتيح لك البيانات الكبيرة الحصول على إجابات أكثر اكتمالاً وذلك بفضل توفر المزيد من المعلومات.
  • تشير الإجابات الكاملة إلى المزيد من الثقة في البيانات، الأمر الذي يعني نهجًا مختلفًا تمامًا لمعالجة المشكلات.

حالات استخدام البيانات الكبيرة

يمكن أن تساعدك البيانات الكبيرة على معالجة مجموعة من أنشطة الأعمال، بدءًا من تجربة العملاء وحتى التحليلات. هذه مجرد أمثلة قليلة.

تطوير المنتجات تستخدم مجموعة من الشركات مثل Netflix وProcter & Gamble البيانات الكبيرة لتوقع احتياجات العملاء. تنشئ هذه الشركات نماذج تنبؤية للمنتجات والخدمات الجديدة عن طريق تصنيف السمات الرئيسية للمنتجات أو الخدمات السابقة والحالية ونمذجة العلاقة بين هذه السمات والنجاح التجاري للعروض. بالإضافة إلى ذلك، تستخدم P&G البيانات والتحليلات من مجموعات التركيز، ومواقع التواصل الاجتماعي، والأسواق التجريبية، وإطلاقات المتاجر المبكرة للتخطيط لمنتجات جديدة وإنتاجها وإطلاقها.
الصيانة التنبؤية قد يتم غرس العوامل التي يمكنها التنبؤ بالفشل الميكانيكي بعمق في البيانات المنظمة، مثل السنة، والصنع، ونموذج المعدات، بالإضافة إلى البيانات غير المنظمة التي تغطي الملايين من إدخالات السجلات، وبيانات المستشعرات، ورسائل الخطأ، ودرجة حرارة المحرك. من خلال تحليل مؤشرات المشكلات المحتملة هذه قبل حدوث المشكلات، يمكن للمؤسسات نشر الصيانة بصورة أكثر فعالية من حيث التكلفة وزيادة أوقات تشغيل الأجزاء والمعدات.
تجربة العملاء بدأ السباق لجذب العملاء. أصبح الحصول على رؤية أكثر وضوحًا لتجارب العملاء ممكنًا الآن بصورة تفوق أي وقت مضى. تتيح لك البيانات الكبيرة إمكانية جمع البيانات من مواقع التواصل الاجتماعي وزيارات الويب وسجلات المكالمات وغيرها من المصادر لتحسين تجربة التفاعل زيادة القيمة المقدمة إلى أقصى حد. ابدأ في تقديم عروض مخصصة، وتقليل تحوّل العملاء، وعالج المشكلات على نحو استباقي.
الاحتيال والامتثال عندما يتعلق الأمر بالأمان، لا يتوقف الأمر على مجموعة من المتطفلين المحتالين، فأنت تواجه فرق كاملة من الخبراء. تتطور جوانب الأمان ومتطلبات الامتثال بصورة مستمرة. تساعدك البيانات الكبيرة على تحديد الأنماط في البيانات التي تشير إلى الاحتيال وتجميع قدر كبير من المعلومات لجعل التقارير التنظيمية أكثر سرعة بكثير.
التعلم الآلي يعد التعلم الآلي موضوعًا مثيرًا في الوقت الحالي. وتعد البيانات - وبالأخص البيانات الكبيرة - أحد أسباب ذلك. نمتلك الآن القدرة على تعليم الآلات بدلاً من برمجتها. إن توفر البيانات الكبيرة لتدريب نماذج التعلم الآلي يجعل هذا الأمر ممكنًا.
الكفاءة التشغيلية‬ قد لا تصنع الكفاءة التشغيلية الحدث دائمًا، ولكنها مساحة تكون فيها للبيانات الكبيرة أكبر الأثر. من خلال البيانات الكبيرة، يمكنك تحليل وتقييم الإنتاج، وملاحظات العملاء والمرتجعات، وعوامل أخرى لتقليل الانقطاعات وتوقع الطلبات المستقبلية. يمكن أيضًا استخدام البيانات الكبيرة لتحسين عملية اتخاذ القرار بصورة تتماشى مع متطلبات السوق الحالية.
دفع الابتكار يمكن أن تساعدك البيانات الكبيرة على الابتكار من خلال دراسة الترابطات بين البشر والمؤسسات والكيانات والعملية، ثم تحديد طرق جديدة لإدخال هذه الأفكار إلى حيز الاستخدام. استخدم رؤى البيانات لتحسين القرارات ذات الصلة بالاعتبارات المالية والتخطيطية. ادرس الاتجاهات ورغبات العملاء لتقديم منتجات وخدمات جديدة. طبِّق نموذج التسعير الديناميكي. هناك احتمالات لا حصر لها.

تحديات البيانات الكبيرة

على الرغم من أن البيانات الكبيرة تحمل الكثير من الوعود، فهي لا تخلو من التحديات.

أولاً، البيانات الكبيرة…كبيرة. على الرغم من تطوير تقنيات جديدة في مجال تخزين البيانات، تتضاعف أحجام البيانات كل عامين تقريبًا. لا تزال المؤسسات تكافح لمواكبة تطور بياناتها وإيجاد طرق لتخزينها على نحو فعال.

لكن مجرد تخزين البيانات لا يعد كافيًا. يجب استخدام البيانات لتكون ذات قيمة وهذا يتوقف على التنظيم. تتطلب البيانات النظيفة، أو البيانات المتربطة بالعميل والمنظمة بطريقة تتيح إجراء تحليلات مفيدة، الكثير من العمل. يقضي علماء البيانات من 50 إلى 80 في المائة من أوقاتهم في تنسيق البيانات وإعدادها قبل استخدامها بصورة فعلية.

وأخيرًا، تتغير تقنية البيانات الكبيرة بوتيرة سريعة. قبل بضع سنوات، كانت Apache Hadoop هي التقنية الشائعة التي تُستخدم لمعالجة البيانات الكبيرة. ثم تم طرح Apache Spark في عام 2014. واليوم، يبدو أن المزج بين إطاري العمل يمثل أفضل نهج. تمثل مواكبة تقنية البيانات الكبيرة تحديًا مستمرًا.

اكتشاف المزيد من موارد البيانات الكبيرة:

كيف تعمل البيانات الكبيرة

تمنحك البيانات الكبيرة رؤى جديدة تفتح لك فرصًا ونماذج أعمال جديدة. تتضمن مرحلة البدء ثلاثة إجراءات رئيسية:

1.  دمج
البيانات الكبيرة يجمع البيانات من العديد من المصادر والتطبيقات المتنوعة. إن آليات تكامل البيانات التقليدية، مثل الاستخراج والتحويل والتحميل (ETL) لا ترقى بوجه عام إلى مستوى المهمة. إنها تتطلب إستراتيجيات وتقنيات جديدة لتحليل مجموعات البيانات الكبيرة بمقياس وحدات تيرابايت أو حتى بيتابايت.

أثناء التكامل، تحتاج إلى إحضار البيانات ومعالجتها والتأكد من تنسيقها وتوفرها في صورة يمكن لمحللي الأعمال البدء بها.

2.  تتطلب إدارة
البيانات الكبيرة وجود مساحة تخزين. يمكن أن يوجد حل التخزين المتوفر لديك في السحابة أو في أماكن العمل أو كليهما. يمكنك تخزين بياناتك بأي صورة تريدها وتقديم متطلبات المعالجة المطلوبة لديك ومحركات المعالجة اللازمة لمجموعات البيانات هذه على أساس الطلب. يختار العديد من الأشخاص حل التخزين المتوفر لديهم وفقًا لمكان وجود بياناتهم حاليًا. تكتسب السحابة شعبية بصورة تدريجية لأنها تدعم متطلبات الحوسبة الحالية لديك وتتيح لك إمكانية تدوير الموارد حسب الحاجة.

3.  إن تحليل
استثمارك في البيانات الكبيرة يحقق أهدافه عند تحليل بياناتك والتصرف بناءً على ذلك. ارتقِ إلى مستوى جديد من الوضوح من خلال التحليل المرئي لمجموعات البيانات المتنوعة لديك. استكشف البيانات بصورة أكبر لإجراء اكتشافات جديدة. شارك نتائجك مع الآخرين. صمم نماذج البيانات من خلال التعلم الآلي والذكاء الاصطناعي. ضع بياناتك في حيز العمل.

أفضل ممارسات البيانات الكبيرة

لمساعدتك خلال رحلة البيانات الكبيرة، قمنا بتجميع مجموعة من أفضل الممارسات الرئيسية التي يجب مراعاتها. تتوفر فيما يلي إرشاداتنا المتعلقة بتصميم مؤسسة بيانات كبيرة ناجحة.

مواءمة البيانات الكبيرة مع أهداف العمل المحددة تتيح لك مجموعات البيانات الأكثر شمولاً إمكانية إجراء اكتشافات جديدة. ولتحقيق هذه الغاية، من المهم ترسيخ استثمارات جديدة في المهارات أو التنظيم أو البنية التحتية إلى جانب سياق قوي تحركه الأعمال لضمان استمرارية استثمارات المشروعات وتمويلها. لتحديد ما إذا كنت على الطريق الصحيح، تساءل عن كيفية دعم البيانات الكبيرة وتمكين أولويات العمل لديك وتكنولوجيا المعلومات. تتضمن الأمثلة فهم كيفية تصفية سجلات الويب لفهم سلوك التجارة الإلكترونية، واستخلاص المشاعر من مواقع التواصل الاجتماعي وتفاعلات دعم العملاء، وفهم طرق الارتباط الإحصائي ومدى ملاءمتها لبيانات العميل والمنتجات وعمليات التصنيع والهندسة.
معالجة النقص في المهارات من خلال المعايير والحوكمة تتمثل واحدة أكبر العقبات التي تحول دون الاستفادة من استثمارك في البيانات الكبيرة في نقص المهارات. يمكنك التخفيف من حدة هذه المخاطر من خلال ضمان إضافة تقنيات البيانات الكبيرة والاعتبارات والقرارات المتصلة بها إلى برنامج حوكمة تكنولوجيا المعلومات لديك. سيتيح لك توحيد نهجك إمكانية إدارة التكاليف وزيادة الموارد. يجب على المؤسسات التي تنفذ حلول البيانات الكبيرة وإستراتيجياتها تقييم متطلبات المهارات الخاصة بهم في وقت مبكر وعلى نحو متكرر ويجب أن تحدد بصورة استباقية أي ثغرات محتملة في المهارات. يمكن معالجة ذلك من خلال التدريب/التدريب الشامل على الموارد الحالية، والاستعانة بموارد جديدة، والاستفادة من الهيئات الاستشارية.
تحسين نقل المعرفة من خلال مركز التميز استخدم نهج مركز التميز لمشاركة المعرفة ومراقبة الإشراف وإدارة اتصالات المشروعات. سواء كانت البيانات الكبيرة تمثل استثمارًا جديدًا أو موسعًا، يمكن مشاركة التكاليف الأساسية والإضافية عبر المؤسسة. يمكن أن تساعد الاستفادة من هذا النهج على زيادة قدرات البيانات الكبيرة واكتمال بنية المعلومات بوجه عام على نحو أكثر تنظيمًا ومنهجية.
الفائدة الأعلى تتمثل في موائمة البيانات غير المنظمة مع البيانات المنظمة

من المؤكد أنه من المفيد إجراء تحليل البيانات الكبيرة بمفرده. ولكن يمكنك تقديم رؤى أعمال أكبر من خلال ربط البيانات الكبيرة ذات الكثافة المنخفضة ودمجها مع البيانات المنظمة التي تستخدمها بالفعل في الوقت الحالي.

سواء كنت تسعى للحصول على البيانات الكبيرة للعملاء أو المنتجات أو المعدات أو البيئة، يتمثل الهدف في إضافة المزيد من نقاط البيانات ذات الصلة إلى الملخصات الرئيسية والتحليلية الرئيسية، مما يؤدي إلى تحقيق استنتاجات أفضل. على سبيل المثال، هناك اختلاف في التمييز بين مشاعر جميع العملاء ومشاعر أفضل العملاء فقط. وهذا هو السبب في رؤية الكثيرين للبيانات الكبيرة باعتبارها امتدادًا متكاملاً لقدرات ذكاء الأعمال الحالية لديهم ومنصة تخزين البيانات وبنية المعلومات.

تذكر أن العمليات التحليلية للبيانات الكبيرة ونماذجها قد تكون قائمة على الإنسان والآلة. تتضمن القدرات التحليلية للبيانات الكبيرة الإحصاءات والتحليل المكاني والدلالات والاكتشاف التفاعلي والعروض المرئية. باستخدام النماذج التحليلية، يمكنك ربط أنواع ومصادر مختلفة من البيانات لتكوين اتحادات واكتشافات مفيدة.

خطط لمعمل الاكتشاف لديك لتعزيز الأداء

إن اكتشاف المعنى في بياناتك لا يتسم دائمًا بالسهولة. أحيانًا لا نعرف حتى ما نبحث عنه. وهذا أمر متوقع. ينبغي على الإدارة وتكنولوجيا المعلومات دعم هذا "الافتقار إلى التوجيه" أو "عدم وجود متطلبات واضحة".

وفي الوقت نفسه، من الضروري أن يعمل المحللين وعلماء البيانات عن كثب مع الشركة لاستيعاب الفجوات والمتطلبات الرئيسية في معرفة الأعمال. لاستيعاب الاستكشاف التفاعلي للبيانات وتجربة الخوارزميات الإحصائية، يجب أن تتوفر لديك مناطق عمل عالية الأداء. تأكد من أن بيئات وضع الاختبار المعزولة تتلقى الدعم الذي تحتاجه - وتخضع للتحكم بصورة صحيحة.

المواءمة مع نموذج التشغيل السحابي تحتاج عمليات البيانات الكبيرة والمستخدمون إلى الوصول إلى مجموعة واسعة من الموارد بغية التجريب التكراري وتشغيل الوظائف الإنتاجية. يشتمل حل البيانات الكبيرة على جميع مجالات البيانات التي تشمل المعاملات والبيانات الرئيسية والبيانات المرجعية والبيانات الموجزة. يجب إنشاء بيئات اختبار معزولة تحليلية عند الطلب. تعد إدارة الموارد أمرًا بالغ الأهمية لضمان التحكم في تدفق البيانات بصورة كاملة بما في ذلك المعالجة المسبقة واللاحقة، والتكامل، والتلخيص في قاعدة البيانات، والنمذجة التحليلية. تلعب إستراتيجية توفير السحابة الخاصة والعامة وأمانها المخططة بصورة جيدة دورًا أساسيًا في دعم هذه المتطلبات المتغيرة.