Oracle Cloud Infrastructure (OCI) 上的高性能计算 (HPC) 提供经济高效的强大计算功能,可以解决各行各业复杂的数学和科学问题。OCI 的裸金属服务器可与 Oracle 集群网络搭配使用,通过融合以太网 (RoCE) v2 访问超低延迟的 RDMA(在数万个核心集群中实现低于 2 微秒的延迟)。
基于 OCI 的 HPC 的性能堪比本地部署解决方案,并且具备云技术的弹性和基于用量的经济性,支持用户按需同步扩展数万个内核。通过基于 OCI 的 HPC,您可以访问高频率处理器、快速且密集的本地存储、高吞吐量且超低延迟的 RDMA 集群网络以及可自动无缝运行作业的工具。
观看视频 (2:42)
了解基于 Oracle Cloud Infrastructure 的高性能计算 (HPC) 为什么是您理想的 HPC 工作负载解决方案,以及如何通过 Oracle Cloud Marketplace 轻松部署 HPC 计算集群。
“We now run our HPC workloads on Oracle Cloud Infrastructure as part of our HPC multicloud strategy.OCI has incredible performance, and running computational fluid dynamics simulations with it has allowed us to improve the speed of computations and to optimize costs.This is helping us make the development of cars at Toyota more efficient, and produce cars with better performance.”
丰田汽车 DX 推广部组长
Shinichi Noda
“Races are decided by the narrowest of margins, but when it came to deciding who we wanted to work with, no other cloud company came even close.”
红牛本田赛车队 (Red Bull Racing Honda) 主席
Christian Horner
“We looked for the best price-performance, security, and VMware integrations.We found that in Oracle Cloud Infrastructure.”
Altair 企业解决方案首席技术官
Sam Mahalingam
“We selected Oracle Cloud Infrastructure’s HPC solutions as a part of our multi-cloud strategy to meet the challenges of increased simulation demand under constant cost savings pressure.I believe Oracle will bring significant ROI to Nissan.”
日产汽车 (Nissan Motor Co, Ltd) 工程系统部门总经理
Bing Xu
“Around the globe, virtualization is helping enterprises stay productive during these challenging times.With Quadro Virtual Workstations on Oracle Cloud, creative and technical professionals can easily access the performance they need to work anywhere.”
NVIDIA 虚拟化产品营销高级总监
Anne Hecht
“Oracle Cloud Infrastructure is able to support deterministic latencies at the 10μs level at very high message volumes.There is sufficient evidence to justify exploring deployment of low-latency sensitive applications to OCI.This is significant because services requiring this service level avoid expensive on-site deployments.”
BJSS 首席技术官
Larry Ryan
“Oracle’s bare metal compute and cluster networking technologies allowed BeeGFS on Oracle Cloud to outperform our on-premises HPC file system latency and throughput for MPAS workloads at a very low price point.Using Oracle Cloud’s RDMA cluster networking, BeeGFS can see performance of up to 140 GB/s with as little as 14 servers.”
YellowDog 首席技术官
Simon Ponsford
甲骨文公司高级副总裁兼 OCI 首席技术架构师 Pradeep Vincent
甲骨文公司副总裁兼杰出工程师 Jag Brar
OCI 架构师详细介绍了他们在构建大规模 RDMA 超级集群以支持数以万计的 GPU 时是如何应用 RDMA 网络的,该网络使用 NVIDIA ConnectX RDMA 网络接口卡。
阅读全文Oracle Cloud Infrastructure 为 HPC 解决方案提供出色的性价比。OCI 的裸金属服务器可与 Oracle 集群网络搭配使用,通过融合以太网 (RoCE) v2 访问超低延迟的 RDMA(在数万个核心集群中实现低于 2 微秒的延迟)。客户可以借助这些功能获得优化的性能,并以更低的成本扩展高需求量的 HPC 工作负载。此外,Oracle 扁平的双层网络拓扑可以统一所有节点的带宽和延迟,让 HPC 集群能够以平价扩展。
使用 Oracle Cloud Marketplace 堆栈中的 Terraform 模板自动部署低延迟的 RDMA 集群,从而加快在多台计算机中运行性能密集型工作负载的速度。此模板为 HPC 提供了天气建模、CFD 模拟、计算化学、基因分析以及其他用例的基础。借助堆栈,您还可以安装 Slurm 调度程序、OpenMPI 和工具,以轻松测试 MPI 连接。
Oracle 将帮助客户在 Oracle HPC 基础设施中高效运行人工智能或机器学习工作负载,包括快速而大量的存储和计算能力。为了进一步支持数据科学团队,Oracle 推出了面向数据科学的 Oracle Cloud Infrastructure 虚拟机。这种预配置环境可以让客户更快地构建模型和实现业务价值。OCI Virtual Machines for Data Science Service 具备出色的性能、安全性和控制力。借助 OCI,客户可以根据需求使用计算自动伸缩功能扩展计算资源,在不需要计算实例时可以通过停止计算实例来控制成本。
此外,每一台虚拟机都附带一个 NVIDIA GPU 且已经预安装了通用 IDE、笔记本和框架,可以在 15 分钟内启动并运行。借助面向数据科学的 Oracle Cloud Infrastructure 虚拟机,数据科学团队也能够测试和浏览基本的数据和代码。
Oracle Cloud Infrastructure 为 Intel、AMD、NVIDIA 和 Ampere 基于 CPU/GPU 架构的裸金属和虚拟机实例提供了多种计算选项。
Oracle 与一众商业和开源项目紧密合作,为客户提供全面支持。我们的合作伙伴皆在 Oracle Cloud Infrastructure 上测试和构建软件,从而在一系列的计算任务中改进客户的解决方案设计。
高核心频率和集群网络为 Oracle 裸金属计算实例提供了比其他公有云和现场数据中心更高的性能。此外,裸金属计算实例还可以提供出色的隔离、可见性和控制。
Oracle 标准裸金属服务器包含支持极速网络的双 25 Gbps 以太网,而突破性后端网络结构则采用了 Mellanoxs ConnectX-5,100 Gbps 网络接口卡,可基于融合以太网 (RoCE) v2 提供 RDMA,从而创建与具有与本地部署集群同样低延迟网络和应用可扩展性的集群。
面向高性能计算的 Oracle Linux 兼有一个全面受支持、开放和功能完备的操作环境,该操作环境与 Red Hat Enterprise Linux 保持 100% 二进制兼容。Oracle Linux 在 Linux 操作系统 (OS) 中提供虚拟化、管理和云原生计算工具,通过一个统一的解决方案来满足高性能计算需求。
传统存储无法为性能密集型工作负载提供足够的吞吐量。为了满足这些需求,Oracle 实现了简单易行的 GlusterFS、BeeGFS、Lustre 和 IBM Spectrum Scale 高性能文件系统的部署工作,可为 HPC 集群提供高达 453 GBps 的聚合吞吐量。
Oracle Marketplace 让我们的客户能够无缝评估、选择和部署端到端的解决方案,同时实现 HPC 解决方案的部署流程自动化。
Oracle 在云中构建了基础设施和服务并提供各行各业的案例,以满足企业客户的需求。
基于 OCI 的 HPC 可以帮助制造业的客户更快地运行大型工作负载和进行更复杂的模拟计算。对于从故障测试模拟到空气动力学工作负载,基于 OCI 的 HPC 都可以提供比其他云技术提供商更高的计算性能。
CFD 是一种常见工作负载,旨在通过模拟空气和流体运动来简化和加快产品设计。例如,在汽车领域,它可以帮助制造商模拟机舱气流、发动机机油动力学以及汽车周围的气流,从而提高燃油效率。它是一种紧密耦合、基于 MPI 的工作负载,可受益于 Oracle 100 Gbps 集群网络、基于 Intel 的高频处理器计算实例以及最新的 NVIDIA GPU。
CFD 是一种常见工作负载,旨在通过模拟空气和流体运动来简化和加快产品设计。例如,在汽车领域,它可以帮助制造商模拟机舱气流、发动机机油动力学以及汽车周围的气流,从而提高燃油效率。它是一种紧密耦合、基于 MPI 的工作负载,可受益于 Oracle 100 Gbps 集群网络、基于 Intel 的高频处理器计算实例以及最新的 NVIDIA GPU。
分子动力学 (MD) 和基因组模拟是生命科学行业常见的工作负载,旨在分析原子和分子的物理运动,一般用于药物研发等用途。通过将这些计算密集型工作负载转移到 OCI,研究人员可以实现优秀的性能、满足规模需求并缩短发现新疗法的时间,进而节省成本。
诸如交易应用等金融应用需要高性能、低延迟的基础设施。这些应用并不是早期云技术架构的设计目标,而且迁移至云端的速度也非常慢。Oracle Cloud Infrastructure 可以满足这些性能需求,例如实现低于 2 微秒的集群内延迟,性能与成本高昂的定制化本地部署解决方案相当,并支持客户赋能这些应用。
高性能计算为当今无所不在的视觉效果提供了强大的动力,无论是开发电影特效、电视广告还是最新的 PC 和主机游戏,媒体和游戏公司都需要依托于按需可用的 HPC 和 GPU 性能。OCI 提供 HPC 和 GPU 驱动的裸金属实例,比如 NVIDIA Quadro 虚拟工作站,其性能与昂贵的高端图形工作站一致,且价格更低。
Oracle Cloud Infrastructure 的超级计算平台支持研究人员访问裸金属 NVIDIA GPU、高性能计算实例和低延迟集群网络。研究人员可以创建集群来运行大规模计算,从而加速科学和工程多个分支领域的研究,例如药物发现、基因组学、天气预报和太空探索等。通过 Oracle for Research 等计划,Oracle 与英国的布里斯托大学和伦敦皇家霍洛威大学等研究组织开展紧密合作,共同帮助加速疫苗研发以及开发应对气候变化的前沿解决方案。
注:为免疑义,本网页所用以下术语专指以下含义: