高性能计算 (HPC)

Oracle Cloud Infrastructure (OCI) 上的高性能计算 (HPC) 提供经济高效的强大计算功能,可以解决各行各业复杂的数学和科学问题。OCI 的裸金属服务器可与 Oracle 集群网络搭配使用,通过融合以太网 (RoCE) v2 访问超低延迟的 RDMA(在数万个核心集群中实现低于 2 微秒的延迟)。

基于 OCI 的 HPC 的性能堪比本地部署解决方案,并且具备云技术的弹性和基于用量的经济性,支持用户按需同步扩展数万个内核。通过基于 OCI 的 HPC,您可以访问高频率处理器、快速且密集的本地存储、高吞吐量且超低延迟的 RDMA 集群网络以及可自动无缝运行作业的工具。

观看视频 (2:42)

Ansys Mechanical 在 OCI 上的性能

了解 OCI 与用于 Ansys Mechanical 模拟的先进专用本地硬件系统的比较。浏览多个选项,并选择最适合您的资产方案。

使用 OCI 快速部署 HPC 工作负载 使用 OCI 快速部署 HPC 工作负载

了解基于 Oracle Cloud Infrastructure 的高性能计算 (HPC) 为什么是您理想的 HPC 工作负载解决方案,以及如何通过 Oracle Cloud Marketplace 轻松部署 HPC 计算集群。

OCI 给您如同本地部署一般的性能和控制体验OCI 给您如同本地部署一般的性能和控制体验

详细了解 Oracle HPC 解决方案,该解决方案以更低的价格提供先进的计算、存储、网络和相关软件技术,并且确保达到与本地部署同等的性能。

丰田将高性能工作负载迁移至 Oracle Cloud

“We now run our HPC workloads on Oracle Cloud Infrastructure as part of our HPC multicloud strategy.OCI has incredible performance, and running computational fluid dynamics simulations with it has allowed us to improve the speed of computations and to optimize costs.This is helping us make the development of cars at Toyota more efficient, and produce cars with better performance.”

丰田汽车 DX 推广部组长
Shinichi Noda

红牛本田赛车队与 Oracle 联手在一级方程式赛车中提升数据分析能力

“Races are decided by the narrowest of margins, but when it came to deciding who we wanted to work with, no other cloud company came even close.”

红牛本田赛车队 (Red Bull Racing Honda) 主席
Christian Horner

Altair 在 OCI 上连夜测试和运行复杂的模拟程序

“We looked for the best price-performance, security, and VMware integrations.We found that in Oracle Cloud Infrastructure.”

Altair 企业解决方案首席技术官
Sam Mahalingam

日产利用 Oracle Cloud HPC 加快产品上市速度

“We selected Oracle Cloud Infrastructure’s HPC solutions as a part of our multi-cloud strategy to meet the challenges of increased simulation demand under constant cost savings pressure.I believe Oracle will bring significant ROI to Nissan.”

日产汽车 (Nissan Motor Co, Ltd) 工程系统部门总经理
Bing Xu

Oracle Cloud Infrastructure 提供 NVIDIA Quadro 虚拟工作站映象

“Around the globe, virtualization is helping enterprises stay productive during these challenging times.With Quadro Virtual Workstations on Oracle Cloud, creative and technical professionals can easily access the performance they need to work anywhere.”

NVIDIA 虚拟化产品营销高级总监
Anne Hecht

BJSS 在 Oracle Cloud 上将高性能计算速度提升了 5 倍

“Oracle Cloud Infrastructure is able to support deterministic latencies at the 10μs level at very high message volumes.There is sufficient evidence to justify exploring deployment of low-latency sensitive applications to OCI.This is significant because services requiring this service level avoid expensive on-site deployments.”

BJSS 首席技术官
Larry Ryan

YellowDog 借助 Oracle Cloud 引领高速 HPC 渲染作业

“Oracle’s bare metal compute and cluster networking technologies allowed BeeGFS on Oracle Cloud to outperform our on-premises HPC file system latency and throughput for MPAS workloads at a very low price point.Using Oracle Cloud’s RDMA cluster networking, BeeGFS can see performance of up to 140 GB/s with as little as 14 servers.”

YellowDog 首席技术官
Simon Ponsford

2023 年 2 月 14 日

首要原则:规模化、超高性能的 RDMA 超级集群

甲骨文公司高级副总裁兼 OCI 首席技术架构师 Pradeep Vincent
甲骨文公司副总裁兼杰出工程师 Jag Brar

OCI 架构师详细介绍了他们在构建大规模 RDMA 超级集群以支持数以万计的 GPU 时是如何应用 RDMA 网络的,该网络使用 NVIDIA ConnectX RDMA 网络接口卡。

阅读全文

HPC 参考架构

查看所有参考架构

基于 OCI 的 HPC 是客户所选

出色的性价比

Oracle Cloud Infrastructure 为 HPC 解决方案提供出色的性价比。OCI 的裸金属服务器可与 Oracle 集群网络搭配使用,通过融合以太网 (RoCE) v2 访问超低延迟的 RDMA(在数万个核心集群中实现低于 2 微秒的延迟)。客户可以借助这些功能获得优化的性能,并以更低的成本扩展高需求量的 HPC 工作负载。此外,Oracle 扁平的双层网络拓扑可以统一所有节点的带宽和延迟,让 HPC 集群能够以平价扩展。


自动部署 RDMA 群集

使用 Oracle Cloud Marketplace 堆栈中的 Terraform 模板自动部署低延迟的 RDMA 集群,从而加快在多台计算机中运行性能密集型工作负载的速度。此模板为 HPC 提供了天气建模、CFD 模拟、计算化学、基因分析以及其他用例的基础。借助堆栈,您还可以安装 Slurm 调度程序、OpenMPI 和工具,以轻松测试 MPI 连接。

简单的 AI/ML 和数据科学

Oracle 将帮助客户在 Oracle HPC 基础设施中高效运行人工智能或机器学习工作负载,包括快速而大量的存储和计算能力。为了进一步支持数据科学团队,Oracle 推出了面向数据科学的 Oracle Cloud Infrastructure 虚拟机。这种预配置环境可以让客户更快地构建模型和实现业务价值。OCI Virtual Machines for Data Science Service 具备出色的性能、安全性和控制力。借助 OCI,客户可以根据需求使用计算自动伸缩功能扩展计算资源,在不需要计算实例时可以通过停止计算实例来控制成本。

此外,每一台虚拟机都附带一个 NVIDIA GPU 且已经预安装了通用 IDE、笔记本和框架,可以在 15 分钟内启动并运行。借助面向数据科学的 Oracle Cloud Infrastructure 虚拟机,数据科学团队也能够测试和浏览基本的数据和代码。

在各种计算配置上运行 HPC 工作负载

Oracle Cloud Infrastructure 为 Intel、AMD、NVIDIA 和 Ampere 基于 CPU/GPU 架构的裸金属和虚拟机实例提供了多种计算选项。

丰富的 HPC 合作伙伴生态系统

Oracle 与一众商业和开源项目紧密合作,为客户提供全面支持。我们的合作伙伴皆在 Oracle Cloud Infrastructure 上测试和构建软件,从而在一系列的计算任务中改进客户的解决方案设计。


面向 HPC 的 OCI Architecture Center

您所需的一切基于 OCI 的 HPC 指导和技术资源,尽在 OCI Architecture Center。

基于 OCI 的 HPC 技术中心

设计托管 SaaS 应用的基础设施
裸金属 HPC 计算实例

高核心频率和集群网络为 Oracle 裸金属计算实例提供了比其他公有云和现场数据中心更高的性能。此外,裸金属计算实例还可以提供出色的隔离、可见性和控制。

集群网络
快速集群网络

Oracle 标准裸金属服务器包含支持极速网络的双 25 Gbps 以太网,而突破性后端网络结构则采用了 Mellanoxs ConnectX-5,100 Gbps 网络接口卡,可基于融合以太网 (RoCE) v2 提供 RDMA,从而创建与具有与本地部署集群同样低延迟网络和应用可扩展性的集群。

基于裸金属和虚拟机的 GPU
基于裸金属和虚拟机的 GPU

Oracle Cloud 为图形密集型工作负载提供了高性能虚拟机、裸金属服务器和 GPU,适用于渲染、人工智能和深度学习工作负载。

优化 HPC 实例
优化 HPC 实例

面向高性能计算的 Oracle Linux 兼有一个全面受支持、开放和功能完备的操作环境,该操作环境与 Red Hat Enterprise Linux 保持 100% 二进制兼容。Oracle Linux 在 Linux 操作系统 (OS) 中提供虚拟化、管理和云原生计算工具,通过一个统一的解决方案来满足高性能计算需求。

HPC 文件系统
HPC 文件系统

传统存储无法为性能密集型工作负载提供足够的吞吐量。为了满足这些需求,Oracle 实现了简单易行的 GlusterFS、BeeGFS、Lustre 和 IBM Spectrum Scale 高性能文件系统的部署工作,可为 HPC 集群提供高达 453 GBps 的聚合吞吐量。

Oracle Cloud Marketplace
Oracle Cloud Marketplace

Oracle Marketplace 让我们的客户能够无缝评估、选择和部署端到端的解决方案,同时实现 HPC 解决方案的部署流程自动化。

亲自体验基于 OCI 的 HPC

在 OCI 的 HPC 集群和标准 VM 上运行 OpenFOAM

在 OCI 的 HPC 集群和标准 VM 上运行 OpenFOAM

使用 Resource Manager 部署 GROMACS

使用 Resource Manager 部署 GROMACS

通过 Oracle Marketplace 映像供应 HPC 集群

通过 Oracle Marketplace 映像供应 HPC 集群

按行业分类的 HPC 解决方案

Oracle 在云中构建了基础设施和服务并提供各行各业的案例,以满足企业客户的需求。

制造业

基于 OCI 的 HPC 可以帮助制造业的客户更快地运行大型工作负载和进行更复杂的模拟计算。对于从故障测试模拟到空气动力学工作负载,基于 OCI 的 HPC 都可以提供比其他云技术提供商更高的计算性能。

计算流体动力学 (CFD)

CFD 是一种常见工作负载,旨在通过模拟空气和流体运动来简化和加快产品设计。例如,在汽车领域,它可以帮助制造商模拟机舱气流、发动机机油动力学以及汽车周围的气流,从而提高燃油效率。它是一种紧密耦合、基于 MPI 的工作负载,可受益于 Oracle 100 Gbps 集群网络、基于 Intel 的高频处理器计算实例以及最新的 NVIDIA GPU。

日产 (Nissan) 迁移到 Oracle Cloud Infrastructure,以实现高性能计算

CFD 是一种常见工作负载,旨在通过模拟空气和流体运动来简化和加快产品设计。例如,在汽车领域,它可以帮助制造商模拟机舱气流、发动机机油动力学以及汽车周围的气流,从而提高燃油效率。它是一种紧密耦合、基于 MPI 的工作负载,可受益于 Oracle 100 Gbps 集群网络、基于 Intel 的高频处理器计算实例以及最新的 NVIDIA GPU。

基于 OCI 的生命科学模拟

分子动力学 (MD) 和基因组模拟是生命科学行业常见的工作负载,旨在分析原子和分子的物理运动,一般用于药物研发等用途。通过将这些计算密集型工作负载转移到 OCI,研究人员可以实现优秀的性能、满足规模需求并缩短发现新疗法的时间,进而节省成本。

生命科学

金融服务

诸如交易应用等金融应用需要高性能、低延迟的基础设施。这些应用并不是早期云技术架构的设计目标,而且迁移至云端的速度也非常慢。Oracle Cloud Infrastructure 可以满足这些性能需求,例如实现低于 2 微秒的集群内延迟,性能与成本高昂的定制化本地部署解决方案相当,并支持客户赋能这些应用。


视觉效果渲染

高性能计算为当今无所不在的视觉效果提供了强大的动力,无论是开发电影特效、电视广告还是最新的 PC 和主机游戏,媒体和游戏公司都需要依托于按需可用的 HPC 和 GPU 性能。OCI 提供 HPC 和 GPU 驱动的裸金属实例,比如 NVIDIA Quadro 虚拟工作站,其性能与昂贵的高端图形工作站一致,且价格更低。


高等教育与研究

Oracle Cloud Infrastructure 的超级计算平台支持研究人员访问裸金属 NVIDIA GPU、高性能计算实例和低延迟集群网络。研究人员可以创建集群来运行大规模计算,从而加速科学和工程多个分支领域的研究,例如药物发现、基因组学、天气预报和太空探索等。通过 Oracle for Research 等计划,Oracle 与英国的布里斯托大学和伦敦皇家霍洛威大学等研究组织开展紧密合作,共同帮助加速疫苗研发以及开发应对气候变化的前沿解决方案。


Oracle Playbook 系列

我们将 Oracle 的人员、流程和系统策略的精华和秘诀编纂成册,与您共享。

注:为免疑义,本网页所用以下术语专指以下含义:

  1. 除Oracle隐私政策外,本网站中提及的“Oracle”专指Oracle境外公司而非甲骨文中国。
  2. 相关Cloud或云术语均指代Oracle境外公司提供的云技术或其解决方案。