Oracle Cloud Infrastructure (OCI) Supercluster provides ultrafast cluster networking, HPC storage, and OCI Compute bare metal instances. OCI Supercluster is ideal for training generative AI, including conversational applications and diffusion models. With support for up to tens of thousands of NVIDIA GPUs, OCI Compute bare metal instances and VMs can power applications for computer vision, natural language processing, recommendation systems, and more.
Oracle and NVIDIA partner to speed AI adoption for enterprises (2:06)
نشر ما يصل إلى عشرات الآلاف من وحدات معالجة الرسومات (GPU) لكل مجموعة لزيادة قابلية التوسع
قلِّل الوقت اللازم لتدريب الذكاء الاصطناعي من خلال بنية شبكة إيثرنت البسيطة التي توفِّر أداءً عاليًا على نطاق واسع.
احصل على المساعدة الهندسية مع بنية الحلول والشبكات والأمان والتدقيق وتهيئة الموظفين الجدد وترحيل التطبيقات وغير ذلك الكثير.
يتم توصيل كل مثيل دون أنظمة تشغيل لحوسبة OCI باستخدام شبكة مجموعات OCI فائقة التأخير، والتي يمكن أن تصل إلى عشرات الآلاف من وحدات GPU من NVIDIA H100 أو A100 في مجموعة واحدة. تستخدم هذه المثيلات بنية شبكة OCI الفريدة عالية الأداء، التي تستفيد من RDMA عبر شبكة إيثرنت متقاربة (RoCE) إصدار 2 لمدة ميكروثانية من التأخير بين نقاط التوصيل وعرض النطاق الترددي القريب لسعر الخط.
يوفِّر تنفيذ OCI لـ RoCE v2 ما يلي:
توفِّر الحوسبة عالية الأداء على OCI إمكانات حوسبة فعّالة من ناحية التكلفة لحل المشكلات الرياضية والعلمية المُعقدة في مختلف الصناعات.
يعرِض الرسم البياني أداء نسيج شبكة مجموعة Oracle. أقل من 10000 خلية محاكاة في النواة، يمكن لـ OCI توسيع نطاقها فوق 100% باستخدام رموز CFD الشائعة، نفس الأداء الذي تراه محليًا. من المهم ملاحظة أنه بدون الانتقاص من المحاكاة الافتراضية، يمكن لأجهزة الحوسبة عالية الأداء (HPC) التي تعمل من دون أنظمة تشغيل استخدام جميع المراكز على العقدة دون الحاجة إلى حجز أيّ مراكز للحصول على نفقات إضافية مكلفة.
تنافس HPC في OCI أداء الحلول المحلية مع التكاليف المستندة إلى المرونة والاستهلاك للسحابة، مما يوفر إمكانية حسب الطلب للتوسع بعشرات الآلاف من المراكز في وقت واحد. يمكن للعملاء الوصول إلى معالجات عالية التردد؛ وتخزين محلي سريع وكثيف؛ وشبكات مجموعات RDMA عالية الإنتاجية وذات تأخير منخفض للغاية؛ وأدوات لأتمتة الوظائف وتشغيلها بسلاسة.
يمكن لمنصة OCI توفير فترات كمون منخفضة تصل إلى 1.7 ميكروثانية، أقل من أيّ مورد سحابي آخر، وفقًا لتحليل أجرته Exabyte.io. من خلال تمكين المجموعات المتصلة بـ RDMA، وسعت OCI شبكة المجموعات للخوادم التي لا تعتمد على أنظمة تشغيل والمجهزة بوحدات GPU من نوع NVIDIA H100 وA100 . يتيح نسيج شبكة للواجهة الخلفية الرائد للعملاء إنشاء مجموعات مع نفس الشبكات ذات زمن الوصول المنخفض وقابلية تطوير التطبيقات التي يمكن عملها محليًا.
توفِّر مثيلات وحدة معالجة الرسومات من نوع NVIDIA بدون أنظمة تشغيل من OCI للشركات الناشئة منصة حوسبة عالية الأداء للتطبيقات التي تعتمد على التعلم العميق وأنظمة التوصية ووظائف الحوسبة عالية الأداء المتوازية بشكل كبير. مثيلات وحدة معالجة الرسومات (GPU) مناسبة بشكل مثالي لتدريب النماذج وحساب الاستدلال وتوفير الفيزياء والصور والتطبيقات المتوازية على نطاق واسع.
تقدم OCI مثيلات بثماني وحدات GPU من NVIDIA H100 أو NVIDIA A100. بينما توفر OCI Supercluster القدرة على توسيع نطاق يصل إلى مئات أو آلاف وحدات GPU لكل مجموعة، فإن OCI توفر أيضًا القدرة على النشر على نطاق أصغر بكثير، بدءًا بوحدة معالجة رسومات واحدة فقط.
يستخدم العملاء مثل Adept، وهو بحث عن التعلم الآلي ومختبر المنتجات الذي يطور زميل فريق عالمي للذكاء الاصطناعي، قوة تقنيات OCI وNVIDIA لإنشاء الجيل التالي من نماذج الذكاء الاصطناعي. من خلال تشغيل الآلاف من وحدات معالجة الرسومات NVIDIA على مجموعات من مثيلات الحوسبة بدون أنظمة تشغيل لدى OCI والاستفادة من عرض النطاق الترددي لشبكة OCI، يمكن لشركة Adept تدريب نماذج الذكاء الاصطناعي والتعلم الآلي على نطاق واسع بشكل أسرع وأكثر اقتصادية من ذي قبل.
"مع قابلية التوسع وقوة الحوسبة لـ OCI وتقنية NVIDIA، ندرِّب شبكة عصبية لاستخدام كل تطبيق برمجي وموقع ويب وواجهة برمجة تطبيقات موجودة، وذلك استنادًا إلى الإمكانات التي أنشأها صانعو البرامج بالفعل".
ديفيد لوان، الرئيس التنفيذي
مختبر Adept
"نستعرض هذه العلاقة مع OCI على المدى الطويل. متحمسون للاستفادة من وحدات معالجة الرسومات واستخدام ذلك لتدريب جيلنا القادم من الذكاء الاصطناعي الصوتي. يوجد الكثير مما نعتقد أن OCI ستوفره لنا من ناحية النمو المستقبلي."
جيمس هومو، المؤسس ونائب رئيس المنتجات في
SoundHound
"باستخدام Oracle Cloud، نعمل بين أربع وثماني وحدات GPU بالتوازي مع تسريع تقدمنا البحثي بشكل كبير، مما يعني أنه يمكننا إتمام تجربة في بضع ساعات فحسب."
هيوخين كون، أستاذ مساعد، في المعلوماتية الطبية الحيوية
Emory University
"عند إجراء تجارب بالتكوين نفسه، فإن A100 يستخدم وقتًا أقل بنسبة 25% في المتوسط. ما يجعل عملية إعداد الجهاز على Oracle Cloud أكثر سهولة وسلاسة".
شويانغ كاو، مساعد أبحاث طلاب الدراسات العليا
جامعة ميشيغان
تعرَّف على سبب اكتشاف MosaicML أن OCI هي أفضل أساس لتدريب الذكاء الاصطناعي.
"تمثل Softdrive مستقبل أجهزة الكمبيوتر التجارية. في سوق أجهزة الكمبيوتر السحابية، يعني الأداء كل شيء. حسنت وحدات معالجة الرسومات من NVIDIA على خوادم OCI التي تعمل من دون أنظمة تشغيل التجربة بشكل كبير لعملائنا."
ليونارد آيفي، المؤسس
Softdrive
توفِّر منصة OCI خبراء فنيين رفيعي المستوى لمساعدتك في بدء العمل والتشغيل. نعمل على إزالة الحواجز الفنية لعملية النشر المعقدة، من التخطيط إلى الإطلاق، وذلك للمساعدة على ضمان نجاحك.
تم تصميم OCI للمؤسسات التي تسعى إلى الحصول على أداء أعلى وتكاليف أقل باستمرار وترحيل أسهل إلى السحابة لبرمجياتها المحلية الحالية.
سيشادري دلهيسان وأكشاي بارثاساراثي وروزو تشين، في Oracle
حققت Oracle Cloud Infrastructure (OCI) نتائج قوية عبر مقاييس أداء متعددة في مجموعة MLCommons Inference Datacenter إصدار 3.1 ، المعيار الصناعي لقياس أداء البنية التحتية للذكاء الاصطناعي. تم اختبار OCI عبر عدة أشكال تعمل بوحدات معالجة الرسومات NVIDIA، بما في ذلك وحدة GPU من NVIDIA H100 Tensor Core، ووحدة GPU من NVIDIA A100 Tensor Core، ووحدة GPU من NVIDIA A10 Tensor Core، مع النتائج الرئيسة التالية: