ما هي بحيرة البيانات؟

Data Warehouse + Data Lake = Data Lakehouse

يمكن تعريف مركز البيانات على أنه نظام أساسي حديث للبيانات تم إنشاؤه من مزيج من بحيرة البيانات ومستودع البيانات. وبشكل أكثر تحديدًا، يأخذ مستودع البيانات التخزين المرن للبيانات غير المنظمة من بحيرة بيانات وميزات وأدوات الإدارة من مستودعات البيانات، ثم ينفذها بشكل إستراتيجي معًا كنظام أكبر. يجلب هذا التكامل بين أداتين فريدتين أفضل ما في النظامين للمستخدمين. لتقسيم مستودع البيانات بشكل أكبر، من المهم أولاً فهم تعريف المصطلحين الأصليين بشكل كامل.

بحيرة البيانات في مقابل بحيرة البيانات في مقابل مستودع البيانات

عندما نتحدث عن مركز بيانات، نشير إلى الاستخدام المشترك للأنظمة الأساسية لمستودع البيانات الحالي.

إذن، كيف يجمع مستودع البيانات بين هذين الفكرتين؟ بشكل عام، يزيل مستودع البيانات جدران الصوامع بين بحيرة البيانات ومستودع البيانات. وهذا يعني أنه يمكن نقل البيانات بسهولة بين التخزين المنخفض التكلفة والمرن لمستودع البيانات والعكس صحيح، مما يوفر سهولة الوصول إلى أدوات إدارة مستودع البيانات لتنفيذ المخطط والحوكمة، والتي غالبًا ما يتم تشغيلها بالتعلم الآلي والذكاء الاصطناعي لتطهير البيانات. وتخلق النتيجة مخزن بيانات يدمج جمع بحيرات البيانات بأسعار معقولة وغير منظمة والتأهب القوي لمخزن البيانات. ومن خلال توفير المساحة اللازمة للتجميع من مصادر البيانات المنسقة مع استخدام الأدوات والميزات التي تعد البيانات لاستخدام الأعمال، يعمل مستودع البيانات على تسريع العمليات. بطريقة ما، مستودع البيانات هو مستودعات البيانات - التي تم إنشاؤها من الناحية التصورية في أوائل الثمانينات - أعيد تشغيلها لعالمنا الحديث القائم على البيانات.

ميزات مستودع البيانات

مع فهم المفهوم العام لمركز البيانات، دعونا ننظر بشكل أعمق قليلا في العناصر المحددة المعنية. يقدم مستودع البيانات العديد من القطع المألوفة من مفاهيم مستودع البيانات وبحيرة البيانات التاريخية، ولكن بطريقة تدمجها في شيء جديد وأكثر فعالية للعالم الرقمي اليوم.

ميزات إدارة البيانات

يوفر مستودع البيانات عادةً ميزات إدارة البيانات مثل تطهير البيانات واستخراج وتحويل وتحميل البيانات (ETL) وإنفاذ المخطط. يتم إدخالها في مركز بيانات كوسيلة للإعداد السريع للبيانات، مما يسمح للبيانات من مصادر منسقة بالعمل معًا بشكل طبيعي والاستعداد لمزيد من أدوات التحليل الذكي للأعمال (BI).

صيغ التخزين المفتوح

يعني استخدام صيغ التخزين المفتوحة والموحدة أن البيانات المستمدة من مصادر البيانات المنسقة لها بداية مهمة في القدرة على العمل معًا والاستعداد للتحليلات أو إعداد التقارير.

تخزين مرن

تسهل القدرة على فصل الحوسبة عن موارد التخزين توسيع التخزين حسب الضرورة.

دعم البث

تستخدم العديد من مصادر البيانات التدفق في الوقت الفعلي مباشرة من الأجهزة. تم تصميم مستودع بيانات لدعم هذا النوع من الاستيعاب في الوقت الفعلي بشكل أفضل مقارنة بمخزن بيانات قياسي. مع زيادة تكامل العالم مع أجهزة Internet of Things، يزداد أهمية الدعم في الوقت الفعلي.

أحمال العمل المتنوعة

ونظرًا لأن مستودع البيانات يدمج ميزات كل من مستودع البيانات وبحيرة البيانات، فهو حل مثالي لعدد من أحمال العمل المختلفة. بدءًا من إعداد تقارير الأعمال إلى فرق علوم البيانات إلى أدوات التحليلات، يمكن للصفات المتأصلة في مستودع البيانات دعم أحمال العمل المختلفة داخل المؤسسة.

مزايا مركز البيانات: نظام أساسي حديث للبيانات

من خلال إنشاء مستودع بيانات، يمكن للمؤسسات تبسيط عملية إدارة البيانات الإجمالية من خلال نظام أساسي موحد للبيانات. يمكن أن تحل بحيرة البيانات محل الحلول الفردية من خلال تقسيم جدران المستودعات بين مستودعات متعددة. ويخلق هذا التكامل عملية شاملة أكثر كفاءة بكثير مقارنة بمصادر البيانات المنسقة. وهذا يخلق العديد من المزايا.

  • الإدارة الأقل: باستخدام مستودع بيانات، يمكن لأي مصادر متصلة به الوصول إلى بياناتها ودمجها للاستخدام، بدلاً من استخراجها من البيانات الأولية والاستعداد للعمل داخل مستودع البيانات.
  • تحسين إدارة البيانات: تعمل مراكز البيانات على تبسيط الحوكمة وتحسينها من خلال دمج الموارد ومصادر البيانات، ويتم إنشاؤها باستخدام مخطط مفتوح قياسي، مما يسمح بمزيد من التحكم في الأمان والمقاييس والوصول المستند إلى الأدوار وعناصر الإدارة المهمة الأخرى.
  • المعايير المبسطة: نشأت مستودعات البيانات في الثمانينيات، عندما كانت إمكانية الاتصال محدودة للغاية، مما يعني أنه غالبًا ما تم إنشاء معايير المخطط الموضعية داخل المؤسسات، وحتى الأقسام. واليوم، توجد معايير مخطط قاعدة بيانات مفتوحة لأنواع عديدة من البيانات، وتستفيد مراكز البيانات من ذلك عن طريق استيعاب مصادر بيانات متعددة بمخطط موحد متداخل لتبسيط العمليات.
  • زيادة فعالية التكلفة: يتم بناء مراكز البيانات ببنية تحتية تفصل الحوسبة والتخزين، مما يسمح بإضافة سهلة للتخزين دون الحاجة إلى زيادة قوة الحوسبة. وهذا يؤدي إلى تحقيق توسع فعال من حيث التكلفة من خلال الاستخدام البسيط لتخزين البيانات منخفضة التكلفة.

في حين أن بعض المؤسسات ستنشئ مركز بيانات، فإن مؤسسات أخرى ستشتري خدمة سحابية لمركز البيانات.

قصص نجاح العملاء: Data Lakehouse

صورة مصغرة للفيديو التجريبي
Experian

قم بتجربة تحسين الأداء بنسبة 40% وخفض التكاليف بنسبة 60% عند نقل أحمال عمل البيانات المهمة من السحابات الأخرى إلى مستودع بيانات على OCI، مما أدى إلى تسريع معالجة البيانات وابتكار المنتجات مع توسيع فرص الائتمان في جميع أنحاء العالم.

صورة مصغرة لفيديو Generali
Generali

شركة Generali Group هي شركة تأمين إيطالية واحدة من أكبر قواعد العملاء في العالم. كان لدى Generali العديد من مصادر البيانات، من Oracle Cloud HCM، وغيرها من المصادر المحلية والإقليمية. كانت عملية اتخاذ قرارات الموارد البشرية الخاصة بها ومشاركة الموظفين تؤثر على عوائق الطرق، وسعت الشركة إلى حل لتحسين الكفاءة. أدى دمج Oracle Autonomous Data Warehouse مع مصادر بيانات Generali إلى إزالة المستودعات وإنشاء مورد واحد لجميع تحليلات الموارد البشرية. وقد أدى ذلك إلى تحسين الكفاءة وزيادة الإنتاجية بين موظفي الموارد البشرية، مما سمح لهم بالتركيز على الأنشطة ذات القيمة المضافة بدلاً من التركيز على إنشاء التقارير.

صورة مصغرة لفيديو Lyft
Lyft

كانت شركة Lyft، إحدى الشركات الرائدة في العالم في تقديم خدماتها، تتعامل مع 30 نظامًا مختلفًا للتمويل المنعزل. وأعاق هذا الفصل نمو الشركة وأبطأ العمليات. ومن خلال دمج Oracle Cloud ERP وOracle Cloud EPM مع Oracle Autonomous Data Warehouse، تمكنت شركة Lyft من دمج الإدارة المالية والعمليات والتحليلات في نظام واحد. وقد أدى ذلك إلى تقليل الوقت اللازم لإغلاق دفاترها بنسبة 50%، مع إمكانية زيادة تبسيط العمليات. ووفر هذا أيضًا التكاليف عن طريق تقليل ساعات التعطل.

صورة مصغرة لفيديو Agroscout
Agroscout

Agroscout هو مطور برمجيات يعمل مع مساعدة المزارعين على تعظيم المحاصيل الصحية والآمنة. لزيادة إنتاج الغذاء، استخدم Agroscout شبكة من الطائرات بدون طيار لمسح المحاصيل للبق أو الأمراض. وتحتاج المنظمة إلى طريقة فعالة لتوحيد البيانات ومعالجتها لتحديد علامات خطر المحاصيل. باستخدام Oracle Object Storage Data Lake، قامت الطائرات بدون طيار بتحميل المحاصيل مباشرة. تم إنشاء نماذج التعلم الآلي باستخدام علوم بيانات OCI لمعالجة الصور. وكانت النتيجة عملية محسنة إلى حد كبير مكنت من الاستجابة السريعة لزيادة إنتاج الأغذية.

اكتشف لماذا تعد OCI أفضل مكان لبناء بحيرة

مع كل يوم يمر، يرسل المزيد والمزيد من مصادر البيانات كميات أكبر من البيانات في جميع أنحاء العالم. وبالنسبة لأي مؤسسة، لا يزال هذا المزيج من البيانات المنظمة وغير المنظمة يمثل تحديًا. تربط مراكز البيانات هذه المخرجات المتنوعة وربطها وتحليلها في نظام واحد قابل للإدارة.