請不要錯過我們在 10 月 30 日的獨家即時示範,屆時將展示如何在 OCI 上部署 Llama。瞭解最新生成式 AI 技術的實際應用、探索實際使用案例,以及瞭解如何逐步建置更智慧、更自動化的工作流程。
OCI 的頂尖架構師說明叢集網路如何支援可擴展的 GenAI,從少數 GPU 擴展到有 131,072 個 NVIDIA Blackwell GPU 的 Zettascale OCI 超級叢集。
Oracle AI 基礎架構可隨時隨地擴展、發揮效能和部署。瞭解我們為何以業界頂尖的擴展性、裸機 GPU 執行處理等功能脫穎而出。
探索分析師對具有 AMD GPU 的 OCI AI 基礎架構的看法,以及這種組合如何提高生產力、加速實現價值並降低能源成本。
OCI GPU 掃描器是集中管理的 GPU 效能監控解決方案,有助於免除手動研究和指令碼編寫步驟,簡化基準流程。
OCI GPU 掃描器透過全方位的狀況檢查、基準比較和自動化診斷,將停機時間和誤報情形降到最低。
OCI GPU 掃描器提供可自訂的全租用戶可見性和團隊專屬洞察力,有助於為企業級 GPU 叢集打造最佳化的資源共用和成本管理。
這是一個受管理的集中式解決方案,可免除租用戶中所有區域的手動命令檔執行和相容性研究步驟。為共用大型叢集的團隊啟用分區可見性。
第 0 天 (基準)、第 1 天 (作用中監督) 以及第 2 天 (連同診斷) 的詳細狀況檢查,包括節點、多節點和進階診斷以及歷史比較,以找出問題。
支援 NVIDIA 和 AMD GPU,並計畫為未來的晶片製造商和新一代架構提供支援。
監控所有區域的 GPU 資源,無需在每個區域安裝,支援 Oracle Cloud Infrastructure Kubernetes Engine 叢集、高效能運算叢集、裸機和虛擬機器。
與常見的開放原始碼工具 (包括 Grafana 和 Prometheus) 相容,可為客戶使用案例提供可自訂儀表板和順暢的資料儲存/匯出功能。
提供建議的修正動作 (例如針對 GPU 離線錯誤重新啟動),並透過 API 或入口網站自動執行狀況檢查,以減少客戶停機時間和誤報情形。
深入瞭解 RDMA 叢集網路、GPU 執行個體、裸機伺服器等。
Oracle Cloud 的定價簡單明瞭,在全球各地保持一致的實惠價格,而且支援廣泛的使用案例。若要預估您的費率,請查看費用預估工具,並依照您的需要設定服務。
即時示範日:Oracle、Meta 和 NVIDIA 專家在 OCI 上部署 Llama
首要原則:Zettascale OCI 超級叢集
使用 OCI 加速 AI 工作負載 (PDF)
AMD Instinct MI300X 企業策略群組