Oracle Cloud Infrastructure (OCI) Data Flow هي خدمة Apache Spark تتم إدارتها بالكامل وتقوم بتنفيذ مهام المعالجة على مجموعات البيانات الكبيرة للغاية - من دون بنية أساسية للتوزيع أو الإدارة. يمكن للمطورين أيضًا استخدام Spark Streaming لأداء ETL السحابي على بيانات البث التي يتم إنتاجها باستمرار. يتيح ذلك تسليم التطبيقات بسرعة لأن المطورين يمكنهم التركيز على تطوير التطبيقات، وليس إدارة البنية التحتية.
اكتشف كيف استفاد رونين من OCI Data Flow مع Apache Spark لإنشاء مستقبل يكون فيه كل قرار سريري متأصل في البيانات، ومخصص لفرد معين، ويتم تقديمه بثقة بكفاءة.
شاهد حدث Oracle Developer Live واطلع على كيفية استخدام Data Integration وData Flow لتحسين طريقة استخدام البيانات.
تعلم كيف يجعل Data Flow تشغيل تطبيقات Spark سهلة وآمنة وبسيطة.
يعالج تدفق بيانات OCI توفير البنية التحتية وإعداد الشبكة والتخلص منها عند اكتمال وظائف Spark. كما تتم إدارة التخزين والأمان، مما يعني الحاجة إلى عمل أقل لإنشاء تطبيقات Spark وإدارتها لتحليل البيانات الكبيرة.
باستخدام تدفق بيانات OCI، لا توجد مجموعات لتثبيتها أو تصحيحها أو ترقيتها، مما يوفر الوقت والتكاليف التشغيلية للمشروعات.
يقوم OCI Data Flow بتشغيل كل وظيفة في Spark في الموارد المخصصة الخاصة، مما يؤدي إلى التخلص من الحاجة إلى تخطيط مسبق للسعة.
باستخدام تدفق بيانات OCI، تحتاج تكنولوجيا المعلومات فقط إلى الدفع مقابل موارد البنية الأساسية التي تستخدمها وظائف Spark أثناء تشغيلها.
تدفق Spark من دون إدارة، والتحمل التلقائي للأخطاء، والتصحيح التلقائي.
بفضل دعم Spark Streaming، يمكنك الحصول على إمكانيات للاسترجاع المستمر والتوافر المستمر للبيانات المعالجة. يعالج تدفق بيانات OCI الرفع الثقيل لمعالجة التدفق باستخدام Spark، بالإضافة إلى القدرة على إجراء التعلم الآلي على تدفق البيانات باستخدام MLLib. يدعم تدفق بيانات OCI تخزين كائنات Oracle Cloud Infrastructure (OCI) وأي مصدر تدفق متوافق مع Kafka، بما في ذلك تدفق Oracle Cloud Infrastructure (OCI) كمصادر بيانات.
تعالج Spark البيانات المتأخرة بسبب الانقطاعات المؤقتة ويمكنها التقاط البيانات المتراكمة بمرور الوقت من خلال وضع العلامات المائية - وهي ميزة في Spark تقوم بصيانة البيانات المتأخرة وتخزينها ثم تجميعها - دون الحاجة إلى إعادة تشغيل المهمة يدويًا. يقوم تدفق بيانات OCI بإعادة تشغيل التطبيق تلقائيًا متى أمكن ويمكن للتطبيق المتابعة بسهولة من نقطة الاختبار الأخيرة.
يمكن لتطبيقات تدفق بيانات OCI استخدام مصادقة السحابة الأصلية عبر مديري الموارد حتى تتمكن التطبيقات من العمل لأكثر من 24 ساعة.
الاستفادة من الأمان الذي لا مثيل له من Oracle Cloud Infrastructure. يتم التعامل مع المصادقة والعزل وجميع النقاط المهمة الأخرى. حماية البيانات المهمة للأعمال بأعلى مستويات الأمان.
تستخدم OCI Data Flow الأصلية لنظام إدارة الهوية والوصول في Oracle Cloud للبيانات المراقب والوصول، ومن ثم تظل البيانات آمنة.
تعيين الحصص والحدود لإدارة الموارد المتاحة لتدفق بيانات OCI وتكاليف التحكم.
يعمل تدفق بيانات OCI على تبسيط المهام التشغيلية الشائعة مثل إدارة السجلات والوصول إلى واجهات المستخدم التشغيلية، مما يوفر وقت المطور للتركيز على إنشاء التطبيقات.
يسهّل تدفق بيانات OCI رؤية ما يقوم به مستخدمو Spark من خلال تجميع المعلومات التشغيلية في واجهة مستخدم واحدة قابلة للبحث.
يمكن أن يستغرق تتبع السجلات والأدوات لاستكشاف أخطاء وظيفة Spark وإصلاحها ساعات، ولكن ليس من خلال عرض موحد لمخرجات السجل وخادم محفوظات Spark والمزيد.
الفرز والبحث والتصفية للتحقيق في التطبيقات التاريخية للتعامل بشكل أفضل مع الوظائف باهظة التكلفة وتجنب النفقات غير الضرورية.
يمكن للمسؤولين اكتشاف وظائف Spark المباشرة وإيقافها بسهولة والتي تعمل لفترة طويلة جدًا أو تستهلك الكثير من الموارد وتحفيز التكاليف.
تتطلب النظم البيئية للبيانات الكبيرة العديد من الأجزاء والتكاملات المهمة - ولكن OCI Data Flow متوافق مع استثمارات Spark الحالية وخدمات البيانات الكبيرة، مما يسهل إدارة الخدمة وتقديم نتائجها عند الحاجة إليها.
قم بترحيل تطبيقات Spark الموجودة من Hadoop أو خدمات البيانات الكبيرة الأخرى.
يمكنك تسجيل مخرجات وظائف Spark وتخزينها تلقائيًا وآمنًا، ثم الوصول إليها من خلال واجهة المستخدم أو واجهات برمجة تطبيقات REST لإتاحة التحليلات.
يمكن إدارة جميع جوانب تدفق بيانات OCI باستخدام واجهات برمجة تطبيقات REST بسيطة، بدءًا من إنشاء التطبيق وحتى التنفيذ وحتى الوصول إلى نتائج وظائف Spark.
باستخدام Oracle Cloud Infrastructure Data Flow، حققنا اتفاقيات مستوى الخدمة (SLA) للعملاء من خلال تقليل الوقت اللازم لمعالجة البيانات بنسبة 75% وخفض التكلفة بأكثر من 300%.آرون نيمالا، مدير التسليم بنية التحليلات وتكامل الخدمات العالمية، Oracle
يتم دعم مسرِّع NVIDIA RAPIDS لـ Apache Spark في تدفق بيانات OCI للمساعدة على تسريع عمليات سير عمل الذكاء الاصطناعي وتعلم البيانات والتعلم الآلي.
يدير تدفق البيانات تفريغ ETL من خلال الإشراف على وظائف Spark وتحسين التكلفة وتوفير السعة.
تعمل إمكانات إدارة مخرجات تدفق البيانات على تحسين القدرة على الاستعلام عن البيانات باستخدام Spark.
يمكن تحويل الموارد تلقائيًا للتعامل مع الوظائف التي لا يمكن التنبؤ بها وتقليل التكاليف. توفر لوحة المعلومات طريقة عرض للاستخدام والميزانية لأغراض التخطيط في المستقبل.
يمكن لمطوري التعلم الآلي وSpark استخدام مكتبة التعلم الآلي Spark وتشغيل النماذج بكفاءة أكبر باستخدام Data Flow.
احصل على دعم Spark Streaming مع عدم وجود إدارة وتجاوز تلقائي للأخطاء مع أنظمة متكاملة ومرة واحدة فقط للتصحيح التلقائي.
سجل الاشتراك في حساب Oracle Cloud وجرّب خدمة Data Flow مجانًا.
تعرف على Oracle Cloud Infrastructure Data Flow.
قم بتجربة المنتج المباشر مجانًا.
تحدث إلى عضو فريق حول Oracle Cloud Infrastructure Data Flow.