GPU 实例

Oracle Cloud Infrastructure (OCI) Compute 提供基于 NVIDIA GPU 的裸金属和虚拟机 (VM) 实例,以强大的可扩展性满足主流图形、AI 推断、AI 训练、数字孪生和 HPC 需求。

Modal Labs 利用 OCI 助力开发人员解决 AI 计算挑战 (1:35)
斯坦福大学研究人员利用 Oracle Cloud 研发心力衰竭的新疗法

OCI Supercluster 可大规模提供高性能 GPU,以加快心脏病研究中使用的大型语言模型 (LLM) 训练速度。

为何要选择 OCI for GPU 实例?

可扩展性

131,072

一个 OCI Supercluster 的最大 GPU 数量1

性能

3200

高达 3200 Gb/秒的 RDMA 集群网络带宽2

价值

220%

其他云技术服务供应商的 GPU 价格比 Oracle 更贵,高达 220%3

广泛选择

VM/BM

利用 VM 调整大小,利用裸金属实例优化性能

1:OCI 超级集群可扩展至 131072 个 NVIDIA B200 GPU(计划中);NVIDIA GB200 超级芯片中超过 100000 个 NVIDIA B200 GPU(计划中);65536 个 H200 GPU(计划中);32768 个 NVIDIA A100 GPU;以及 16384 个 NVIDIA H100 GPU。

2:针对具有 NVIDIA H100 GPU 的裸金属实例。

3:根据截至 2024 年 6 月 5 日的按需定价。

GPU 实例关键特性

OCI 在主流云技术供应商中率先提供基于 NVIDIA GPU 的裸金属实例,能够为客户提供零虚拟化开销的强大性能。对于 AI 训练中的检查点,Oracle 实例单节点可提供最高 61.44 TB 的本地存储。

高性能 NVIDIA GPU 实例

NVIDIA Tensor Core GPU

OCI 为搭载 NVIDIA H100 Tensor Core GPUL40S GPUA100 Tensor Core GPUA10 Tensor Core GPU 和其他旧版本的 NVIDIA GPU 的裸金属和虚拟机计算实例提供了超高的价值和性能。OCI 还计划提供基于 NVIDIA H200Blackwell GPU 的实例。

NVIDIA 超级芯片

在 LLM 推断方面,OCI 提供了 NVIDIA GH200 Grace Hopper Supership,并计划推出 GB200 Grace Blackwell Superchip。

高性能集群网络

Oracle 基于 RDMA 的超低延迟集群网络可提供微秒级延迟。

在 VM 实例、裸金属实例和 Kubernetes 集群上部署

虚拟机 (VM) 实例

对于虚拟机,OCI 提供基于 NVIDIA Hopper、Ampere 及其他旧版本的 GPU 架构:1 至 4 个核心,每个 VM 16 至 64 GB 的 GPU 内存,高达 48 Gb/秒的网络带宽。

裸金属实例

OCI Supercluster 具备裸金属实例,搭载了 NVIDIA 的 Blackwell、Hopper 或 Ampere Superchips,每个节点具有 640 GB 的 GPU 内存。

Kubernetes 编排

使用托管式 KubernetesOCI Service MeshOCI Container Registry,编排基于容器运行的 AI 和机器学习 (ML) 训练和推断。

访问现成可用的软件

获取软件和磁盘映像

Oracle Cloud Marketplace 面向数据科学、分析、人工智能 (AI) 和机器学习 (ML) 模型提供相应的软件和磁盘映像,您可以快速获取数据洞察。

NVIDIA AI Enterprise

NVIDIA AI Enterprise 是一个面向数据科学和生产 AI(包括生成式 AI、计算机视觉和语音 AI)的端到端软件平台。

NVIDIA DGX Cloud

NVIDIA DGX Cloud on OCI 是一个 AI 训练即服务平台,能够为开发人员提供针对生成式 AI 进行了优化的无服务器体验。

NVIDIA GPU Cloud 机器映像

使用 NVIDIA GPU Cloud 机器映像获取数百种针对 GPU 优化的机器学习、深度学习和高性能计算应用,满足广泛行业和工作负载的需求。

NVIDIA RTX 虚拟工作站

基于 Oracle Cloud 运行 NVIDIA RTX 虚拟工作站,随时随地为员工提供强大的工作站性能。

自主控制 AI 计算环境和数据

分布式云策略

利用 GPU 计算,OCI 分布式云策略支持企业在自己需要的位置,以自己需要的方式运行 AI 和云技术服务。

主权云

满足区域或国家/地区级数据驻留要求,包括 欧盟美国英国澳大利亚

OCI Dedicated Region

使用 OCI Dedicated Region 在您的数据中心部署完整的云技术区域,完全控制数据和应用。

Oracle Alloy

成为 Oracle Alloy 合作伙伴,向客户提供您自己的云技术服务,满足特定市场需求。

微服务和容器

容器注册表

使用容器构建应用的开发人员可以利用 Oracle 托管的高可用性专用容器注册表服务来存储和共享容器映像,并利用 Docker V2 API 和标准的 Docker 命令行界面 (CLI) 在注册表与容器之间推送/拉取 Docker 映像。支持将映像直接拉取到 Kubernetes 部署中。

Oracle Functions

函数即服务 (FaaS) 支持开发人员运行与 Oracle Cloud Infrastructure、Oracle Cloud Applications 以及第三方服务集成的无服务器应用。借助开源 Fn Project 社区的集体智慧提高开发人员的工作效率。

GPU 实例使用场景

面向深度学习训练和推理的人工智能基础设施

使用 OCI Data Science、裸金属实例、基于 RDMA 的集群网络和 NVIDIA GPU 训练 AI 模型。


AI 训练和推理 下图描述了深度学习模型开发的两个阶段:模型训练和模型推理。在左侧的模型训练中,未经训练的神经网络被输入到由 OCI Data Science、裸金属计算、本地存储和集群网络支持的训练算法中。训练算法的输出是具有新功能的训练模型。右侧描述了模型推理步骤。DALL-E 2 等经过训练的模型可以接受文本输入并生成图像。文本输入被馈送到经过训练的模型中,并提供模型的图像输出。

Virtual Desktop Infrastructure (VDI)

由 NVIDIA GPU 提供支持的 OCI Compute 为 VDI 提供一致的高性能。


Virtual Desktop Infrastructure Virtual Desktop Infrastructure

使用 GPU 实例的 CFD 和高性能计算

OCI 支持计算机辅助工程和计算流体动力学快速预测对象的空气动力学特性。


使用 GPU 实例的 CFD 和高性能计算 使用 GPU 实例的 CFD 和高性能计算

GPU 实例客户成功案例

查看更多客户成功案例
2024 年 9 月 11 日

Oracle 宣布推出基于云技术 Zettascale AI 超级计算机

OCI 执行副总裁 Mahesh Thiagarajan

Oracle Cloud Infrastructure (OCI) 客户一直在 OCI 上运行一些高级 AI 工作负载。他们的成功加强了我们的策略,即为客户提供高性能的 AI 基础设施以及强大的安全性和主权控制,并充分发挥云技术的价值。

阅读全文

赶快行动

试用 Oracle AI 并获得 30 天试用期

Oracle 为大多数 AI 服务提供免费定价套餐,您还可以通过免费试用账户内的 300 美元储值来试用其它云技术服务。Oracle AI 是一个包括生成式 AI 在内的服务组合,它提供预构建机器学习模型,可帮助开发人员更轻松地将 AI 应用到应用和业务运营。

  • 哪些 Oracle AI 和 ML 服务提供免费定价层?

    • OCI Speech
    • OCI Language
    • OCI Vision
    • OCI Document Understanding
    • Machine Learning in Oracle Database
    • OCI Data Labeling

    您只需为 OCI Data Science 支付计算和存储费用。

了解您可以通过 OCI 节省多少成本

在定价方面,Oracle Cloud 采用全球统一超低定价,并支持各种使用场景。请利用成本估算器并配置所需服务,以估算低费率。

联系 GPU 和 AI 技术专家

获取专家帮助,更好地构建您的下一个 GPU 解决方案或在 OCI AI 基础设施上部署 AI 工作负载。

  • 专家能为您解答以下问题:

    • 如何开始使用 Oracle Cloud?
    • 可以在 OCI 上运行哪些 AI 工作负载?
    • OCI 提供哪些类型的 AI 服务?

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国 。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。