بدعم يبدأ من وحدة معالجة رسومات واحدة إلى عشرات الآلاف منها، يمكن للأجهزة الظاهرية للحوسبة من Oracle Cloud Infrastructure (OCI) والمثيلات بدون أنظمة تشغيل التطبيقات للحصول على رؤية الكمبيوتر ومعالجة اللغة الطبيعية وأنظمة التوصية والمزيد. لتدريب نماذج اللغات الكبيرة (LLMs)، بما في ذلك الذكاء الاصطناعي للمحادثة ونماذج النشر، توفِّر OCI Supercluster شبكات مجموعات زمن الوصول الفائقة وتخزين HPC والمثيلات بدون أنظمة تشغيل في OCI Compute المدعومة بوحدات معالجة الرسومات NVIDIA.
تعرَّف على بنية المجموعة الفائقة لـ OCI واستمع إلى العميلين Adept وMosaicML.
يتم توصيل كل مثيل من مثيلات الحوسبة المخصّصة لحوسبة OCI باستخدام شبكة مجموعة التأخير الفائق OCI التي يمكنها توسيع ما يصل إلى 32768 وحدة معالجة رسومات NVIDIA A100 في مجموعة واحدة. تستخدم هذه المثيلات بنية شبكة OCI الفريدة عالية الأداء التي تستفيد من RDMA عبر شبكة إيثرنت متقاربة (RoCE) الإصدار الثاني لإنشاء مجموعات RDMA فائقة مع زمن انتقال بالميكروثانية بين العُقد وعرض النطاق الترددي القريب لسعر الخط البالغ 200 جيجابت/ثانية بين وحدات معالجة الرسومات.
يوفِّر تنفيذ OCI لـ RoCE v2 ما يلي:
توفِّر الحوسبة عالية الأداء على Oracle Cloud Infrastructure إمكانات حوسبة فعّالة من حيث التكلفة لحل المشكلات الرياضية والعلمية المعقدة في مختلف الصناعات.
توفِّر الخوادم بدون أنظمة تشغيل من OCI والمقترنة بالشبكات العنقودية من Oracle الوصول إلى وقت استجابة فائق (أقل من 2 ميكروثانية عبر مجموعات عشرات الآلاف من المراكز) RDMA على شبكة الإيثرنت المتقاربة (RoCE) الإصدار الثاني.
يعرِض الرسم البياني أداء نسيج شبكة مجموعة Oracle. يمكن لـ OCI توسيع نطاقها بنسبة 100% عند أقل من 10,000 خلية محاكاة لكل نواة باستخدام رموز CFD الشائعة، وهو الأداء نفسه الذي قد تراه في البرمجيات المحلية. من المهم ملاحظة أنه بدون الانتقاص من المحاكاة الافتراضية، يمكن لأجهزة الحوسبة عالية الأداء (HPC) التي تعمل من دون أنظمة تشغيل استخدام جميع المراكز على العقدة دون الحاجة إلى حجز أيّ مراكز للحصول على نفقات إضافية مكلفة.
تنافس HPC في OCI أداء الحلول المحلية مع التكاليف المستندة إلى المرونة والاستهلاك للسحابة، مما يوفر إمكانية حسب الطلب للتوسع بعشرات الآلاف من المراكز في وقت واحد.
باستخدام HPC في OCI، يمكنك الوصول إلى معالجات عالية التردد؛ وتخزين محلي سريع وكثيف؛ وشبكات مجموعات RDMA عالية الإنتاجية وذات كُمون منخفض للغاية؛ وأدوات لأتمتة الوظائف وتشغيلها بسلاسة.
يمكن لمنصة OCI توفير فترات كمون منخفضة تصل إلى 1.7 ميكروثانية، أقل من أيّ مورد سحابي آخر، وفقًا لتحليل أجرته Exabyte.io. من خلال تمكين المجموعات المتصلة بـ RDMA، قامت OCI بتوسيع شبكة المجموعات للخوادم التي لا تعتمد على أنظمة تشغيل والمجهزة بوحدات معالجة الرسومات من نوع NVIDIA A100.
يتيح نسيج الشبكة الخلفية الرائد للعملاء استخدام بطاقات واجهة الشبكة بسرعة ConnectX-5 100 جيجابت في الثانية من Mellanox مع الوصول المباشر للذاكرة عن بُعد (RDMA) عبر شبكة إيثرنت متقاربة (RoCE) الإصدار الثاني لإنشاء مجموعات بقابلية التطوير نفسها للتطبيقات والشبكات منخفضة الكُمون والتي يمكن تحقيقها في البرمجيات المحلية.
توفِّر مثيلات وحدة معالجة الرسومات من نوع NVIDIA بدون أنظمة تشغيل من OCI للشركات الناشئة منصة حوسبة عالية الأداء للتطبيقات التي تعتمد على التعلم الآلي ومعالجة الصور ووظائف الحوسبة عالية الأداء المتوازية بشكل كبير. مثيلات وحدة معالجة الرسومات (GPU) مناسبة بشكل مثالي لتدريب النماذج وحساب الاستدلال وتوفير الفيزياء والصور والتطبيقات المتوازية على نطاق واسع.
تشتمل مثيلات BM.GPU4.8 على ثماني وحدات معالجة رسومات من نوع NVIDIA A100 وتستخدم شبكات المجموعات ذات زمن الكُمون المنخفض من Oracle، استنادًا إلى الوصول إلى الذاكرة المباشرة عن بُعد (RDMA) التي تعمل عبر شبكة إيثرنت المتقاربة (RoCE) مع زمن كُمون أقل من 2 ميكروثانية. يمكن للعملاء الآن استضافة أكثر من 500 مجموعة وحدة معالجة رسومات والتوسع بسهولة حسب الطلب.
يستخدم العملاء مثل Adept، وهو بحث عن التعلم الآلي ومختبر المنتجات الذي يطور زميل فريق عالمي للذكاء الاصطناعي، قوة تقنيات OCI وNVIDIA لإنشاء الجيل التالي من نماذج الذكاء الاصطناعي. من خلال تشغيل الآلاف من وحدات معالجة الرسومات NVIDIA على مجموعات من مثيلات الحوسبة بدون أنظمة تشغيل لدى OCI والاستفادة من عرض النطاق الترددي لشبكة OCI، يمكن لشركة Adept تدريب نماذج الذكاء الاصطناعي والتعلم الآلي على نطاق واسع بشكل أسرع وأكثر اقتصادية من ذي قبل.
"مع قابلية التوسع وقوة الحوسبة لـ OCI وتقنية NVIDIA، ندرِّب شبكة عصبية لاستخدام كل تطبيق برمجي وموقع ويب وواجهة برمجة تطبيقات موجودة، وذلك استنادًا إلى الإمكانات التي أنشأها صانعو البرامج بالفعل".
ديفيد لوان، الرئيس التنفيذي
مختبر Adept
"نستعرض هذه العلاقة مع OCI على المدى الطويل. متحمسون للاستفادة من وحدات معالجة الرسومات واستخدام ذلك لتدريب جيلنا القادم من الذكاء الاصطناعي الصوتي. يوجد الكثير مما نعتقد أن OCI ستوفره لنا من ناحية النمو المستقبلي."
جيمس هومو، المؤسس ونائب رئيس المنتجات في
SoundHound
"لقد اخترنا Oracle بسبب القدرة على تحمّل التكلفة والأداء لوحدات معالجة الرسومات (GPU) جنبًا إلى جنب مع البصمة السحابية الواسعة من Oracle. وتُعدّ وحدات معالجة الرسومات (GPU) من الأمور المهمة جدًا لتدريب نماذج الشبكات العصبية العميقة. فكلما كان أداء وحدة معالجة الرسومات (GPU) أعلى، كانت نماذجنا أفضل. ولأننا نعمل في عدة بلدان ومناطق مختلفة، كنا بحاجة إلى البنية التحتية لدعم ذلك".
نيلس هيلست، المؤسس والرئيس التنفيذي
شركة DigiFarm
"عند إجراء تجارب بالتكوين نفسه، فإن A100 يستخدم وقتًا أقل بنسبة 25% في المتوسط. ما يجعل عملية إعداد الجهاز على Oracle Cloud أكثر سهولة وسلاسة".
شويانغ كاو، مساعد أبحاث طلاب الدراسات العليا
جامعة ميشيغان
تعرَّف على سبب اكتشاف MosaicML أن OCI هي أفضل أساس لتدريب الذكاء الاصطناعي.
توفِّر منصة OCI خبراء فنيين رفيعي المستوى لمساعدتك في بدء العمل والتشغيل. نعمل على إزالة الحواجز الفنية لعملية النشر المعقدة، من التخطيط إلى الإطلاق، وذلك للمساعدة على ضمان نجاحك.
تم تصميم OCI للمؤسسات التي تسعى إلى الحصول على أداء أعلى وتكاليف أقل باستمرار وترحيل أسهل إلى السحابة لبرمجياتها المحلية الحالية.
جاغ برار، نائب رئيس OCI والمهندس المتميز، وبارديب فينسنت، نائب الرئيس الأول لـ OCI وكبير المهندسين الفنيين
تقدِّم OCI العديد من الخدمات الفريدة، بما في ذلك شبكة المجموعة، وشبكة أداء فائقة السرعة تدعم الوصول المباشر للذاكرة عن بُعد (RDMA). في فيديو ومدونة المبادئ الأولى السابقة، "إنشاء شبكة ذات أداء عالٍ في السحابة العامة"، شرحنا كيف تستخدم شبكة مجموعات OCI RDMA عبر شبكة إيثرنت المتقاربة (RoCE) لدعم RDMA.
اقرأ المنشور الكامل