Oracle Cloud Infrastructure (OCI) Compute 提供基于 NVIDIA GPU 的裸金属和虚拟机实例,为一系列广泛的使用场景提供强大支持,包括主流的图形和视频、要求严苛的 AI 训练和 HPC 工作负载。OCI 凭借其超低延迟和接近线速的网络性能,在培训时间和成本方面都表现出色。
实例之间的远程直接内存访问 (Remote Direct Memory Access, RDMA) 通信支持具有 1,600 Gb/秒带宽和超低延迟的大型 GPU 集群。
根据您的工作负载选择合适的实例类型。
对于虚拟机来说,可以从 NVIDIA Ampere、Volta 和 Pascal GPU 中选择,这些 GPU 具有 1 至 4 个核心,16 至 64GB 的 GPU 内存,以及高达 480GB 的本地连接闪存。
使用 NVIDIA A100 Tensor Core GPU 为 HPC 和 AI 训练提供集群裸金属实例,每个节点具有 640 GB GPU 内存。
通过隔离网络虚拟化防止租户遭受攻击。作为 Oracle Cloud Infrastructure 安全优先架构的核心,该特性可通过定制设计的 SmartNIC 实现网络隔离和虚拟化,有效防范恶意软件攻击。
利用可按用户和资源逻辑组轻松定义的策略,控制哪些用户能够访问 Oracle Cloud Infrastructure 资源,用户拥有哪些类型的访问权限,以及具体可以访问哪些资源。或通过现有的组织层级结构和联合目录服务(包括 Microsoft、Okta 和其他 SAML 目录提供程序)来管理身份,进行访问授权。
利用定制构建且基于硬件的信任根技术,在每次供应新服务器或建立新租户时擦除并重新安装固件,从而降低 Oracle Cloud Infrastructure 租户遭受基于固件的攻击的风险。
利用符合 PCI 标准的云端全局 Web 应用防火墙 (WAF) 服务保护应用免受恶意和非授权互联网流量攻击。该服务结合了威胁情报和一致的规则实施,能够有效增强防御力并保护面向互联网的应用服务器。
集中管理和控制用于保护企业数据和访问资源的加密密钥和机密凭证,并将其安全存储在符合联邦信息处理标准 (FIPS) 140-2 级别 3 认证的硬件安全模块 (HSM) 中。
用户可以通过 OCI Identity and Access Management 进一步控制单个密钥和密钥库的访问权限,并利用 OCI Audit 来监视密钥生命周期中的所有变更,确保满足日益严格的合规要求。
Oracle 支持广泛的 Microsoft Windows Server 和企业 Linux 操作系统,包括 Oracle Linux、CentOS 和 Ubuntu 等。Oracle Autonomous Linux 是一款免费的自治操作环境,可有效帮助客户消除复杂性和人为错误,从而显著节省成本、增强安全性并提高可用性。
使用 OCI OS Management 服务,您可以为操作系统环境设置自动更新和打补丁策略。
您可以在 Oracle 计算实例上运行自己的操作系统和虚拟机管理程序,并在不同配置下使用同一映像。
Oracle Cloud Marketplace 针对数据科学、分析、人工智能 (AI) 以及机器学习 (ML) 模型提供相应的软件和磁盘映像,您可以快速获取数据洞察。
获取上百种针对 GPU 优化的应用,轻松运行各种行业的机器学习、深度学习和高性能计算工作负载。了解更多。
借助基于 Oracle Cloud 运行的 NVIDIA RTX Virtual Workstation,您可以随时随地为员工提供强大的工作站性能。
使用容器构建应用的开发人员可以利用 Oracle 托管的高可用性专用容器注册表服务来存储和共享容器映像,并利用 Docker V2 API 和标准的 Docker 命令行界面 (CLI) 在注册表与容器之间推送/拉取 Docker 映像。支持将映像直接拉取到 Kubernetes 部署中。
函数即服务 (FaaS) 支持开发人员运行与 Oracle Cloud Infrastructure、Oracle Cloud Applications 以及第三方服务集成的无服务器应用。借助开源 Fn Project 社区的集体智慧提高开发人员的工作效率。
使用 OCI Data Science、裸金属实例、基于 RDMA 的集群网络和 NVIDIA GPU 训练 AI 模型。
由 NVIDIA GPU 提供支持的 OCI Compute 为 VDI 提供一致的高性能。
OCI 支持计算机辅助工程和计算流体动力学快速预测对象的空气动力学特性。
“With the scalability and computing power of OCI and NVIDIA technology, we are training a neural network to use every software application, website, and API in existence—building on the capabilities that software makers have already created.”
Adept 首席执行官 David Luan
“Oracle Cloud Infrastructure allows us to process tens of thousands of models, so we can train our algorithms very quickly.It’s one of the best platforms in the world for the type of work we do.”
James Kelloway
National Grid ESO 能源智能经理
“We view this relationship with OCI as long term.We’re excited about taking advantage of the GPUs and using that to train our next generation of voice AI.There's a lot that we think that OCI will provide for us in terms of future growth.”
联合创始人兼产品副总裁 James Hom
SoundHound
“Softdrive is the future of business computers.In the cloud PC market, performance means everything.NVIDIA GPUs on OCI bare metal servers have dramatically improved the experience for our customers.”
联合创始人 Leonard Ivey
Softdrive
“With NVIDIA GPUs running on OCI bare metal instances, Twist experiences significant performance improvements across its ParaFold and ESMFold AI models.”
“Oracle Cloud Infrastructure is a top tier Hyperscaler cloud that provides XaaS compute and application services to Oracle customers, and offers a lot more than you might expect, including AI/ML and GPU workloads.”
Joel Kaufman
WEKA 高级技术营销经理
“Since moving off AWS, we have quadrupled our data footprint while reducing our costs by 40%.We use 33% less GPU compute capacity on OCI than AWS.”
Suren Gounder
Tango Eye 首席执行官
“The integration with Oracle’s cloud platform provides us with state-of-the-art GPU compute resources, world-class security, and highly flexible VMware environments.Ultimately, this leads to improved productivity, optimized resource utilization, and faster time to market.”
Sam Mahalingam
Altair 首席技术官
GPU 实例以虚拟机和裸金属服务器形式提供,可提供出色的可用性和杰出性能。
款型 |
GPU |
架构 |
GPU 互联 |
GPU 内存 |
CPU 核心 |
CPU 内存 |
存储 |
网络 |
GPU 定价/小时(美元) |
服务器定价/小时(美元) |
大规模横向扩展 AI 训练、数据分析和 HPC | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
BM.GPU.A100-v2.8 |
8 颗 NVIDIA A100 80GB Tensor Core |
Ampere |
NVIDIA NVLINK |
640 GB |
128 |
2048 GB |
4 个 6.8 TB NVMe |
8 x 2 x 100 Gbps RDMA* |
$32 | |
BM.GPU4.8 |
8 颗 NVIDIA A100 40GB Tensor Core |
Ampere |
NVIDIA NVLINK |
320 GB |
64 |
2048 GB |
4 个 6.8 TB NVMe |
8 x 2 x 100 Gbps RDMA* |
$24.4 | |
小规模 AI 训练、推理、流处理、游戏和虚拟桌面基础设施 | ||||||||||
VM.GPU.A10.1 (新) |
1 颗 NVIDIA A10 Tensor Core |
Ampere |
不适用 |
24 GB |
15 |
240 GB |
块存储 |
24 Gbps |
$2 |
|
VM.GPU.A10.2 (新) |
2 颗 NVIDIA A10 Tensor Core |
Ampere |
不适用 |
48 GB |
30 |
480 GB |
块存储 |
48 Gbps |
$4 |
|
BM.GPU.A10.4 |
4 颗 NVIDIA A10 Tensor Core |
Ampere |
不适用 |
96 GB |
64 |
1024 GB |
2 x 3.84 TB NVMe |
2 x 50 Gbps |
$8 |
|
VM.GPU3.1 |
1 颗 NVIDIA V100 Tensor Core |
Volta |
不适用 |
16 GB |
6 |
90 GB |
块存储 |
4 Gbps |
$2.95 |
|
VM.GPU3.2 |
2 颗 NVIDIA V100 Tensor Core |
Volta |
NVIDIA NVLINK |
32 GB |
12 |
180 GB |
块存储 |
8 Gbps |
$5.9 |
|
VM.GPU3.4 |
4 颗 NVIDIA V100 Tensor Core |
Volta |
NVIDIA NVLINK |
64 GB |
24 |
360 GB |
块存储 |
25 Gbps |
$11.8 |
|
BM.GPU3.8 |
8 颗 NVIDIA V100 Tensor Core |
Volta |
NVIDIA NVLINK |
128 GB |
52 |
768 GB |
块存储 |
2 x 25 Gbps |
$23.6 |
|
VM.GPU2.1 |
1 颗 NVIDIA P100 |
Pascal |
不适用 |
16 GB |
12 |
72 GB |
块存储 |
8 Gbps |
$1.28 |
|
BM.GPU2.2 |
2 颗 NVIDIA P100 |
Pascal |
不适用 |
32 GB |
28 |
192 GB |
块存储 |
2 x 25 Gbps |
$2.55 |
OCI Compute 产品管理副总裁 Sagar Rawal
目前,Oracle 已宣布面向部分地区推出基于 NVIDIA H100 Tensor Core GPU 和 NVIDIA 网络的 Oracle Cloud Infrastructure (OCI) Compute 裸金属实例。OCI 裸金属实例可为客户提供始终如一的性能、超低延迟、隔离和控制。
阅读全文免费在 OCI 上构建、测试和部署应用。您只需一次注册,就能获得两项免费服务。
探索 Oracle Cloud 培训资源,包括 Oracle Cloud Infrastructure 培训视频、自主学习实验室和认证。
Oracle Cloud Infrastructure 不仅能提供公有云技术的弹性和实用性,还具有本地计算环境的控制性、安全性、性能和可预测性。
注:为免疑义,本网页所用以下术语专指以下含义: