Oracle Cloud HPCソリューションは、オンプレミス・ソリューションのパフォーマンスとクラウドの柔軟性や使用量に応じた料金などの特長を兼ね備えており、資本集約的なオンプレミス・システムからクラウドに移行する、またはクラウドによってオンプレミス・システムを補完するという選択肢をお客様に提供します。Oracle Cloud Infrastructure HPCプラットフォームには、ベアメタル・コンピュート・インスタンス、レイテンシの低いRDMA用クラスター・ネットワーク、高性能ストレージ・ソリューションとファイルシステム、ネットワーク・トラフィックの分離、クラウドでのジョブの自動化やシームレスな実行に必要なツールが含まれています。自動車業界での衝突シミュレーションから石油・ガス会社の地震分析、メディア企業の特殊効果レンダリングまで、オラクルのクラウドベース・インフラストラクチャには、お客様の複雑な技術的問題をより迅速に解決する力があります。
業界別ソリューション
オラクルは、タイムリーな結果を達成するためにこれまでオンプレミス・システムに依存してきたエンタープライズクラスのお客様のニーズに応えるインフラストラクチャとサービスをクラウド上に構築しています。オラクルのソリューションを利用すれば、設計時に長いキューイング時間や遅延に悩まされることがなくなり、製品の開発、リスクの測定、エクスペリエンスの提供、業界を変革するイノベーションの創出に集中できます。
製造業での数値流体力学
画像提供元:Altair数値流体力学(CFD)は、空気と流体の動きをシミュレートすることで製品エンジニアリングの効率と速度を向上させる一般的なワークロードです。たとえば、自動車業界では、キャビン内の空気の流れ、エンジン・オイルのダイナミクス、車体周りの空気の流れをシミュレートすることで、燃料効率を高めることができます。これは密結合されたMPIベースのワークロードであり、オラクルの100 Gbpsクラスター・ネットワーキング、Intel高周波プロセッサをベースとしたコンピュート・インスタンス、最新のNVIDIA GPUが大いに威力を発揮します。Oracle HPCの料金はAWSより44%安価です。
出典:オープンCAE学会

“オラクルと協力して、Oracle Cloud Infrastructureを活用したCONVERGEをお客様に提供できることをうれしく思います。Oracle Cloud InfrastructureのベアメタルHPCシェイプと低レイテンシのリモート・ダイレクト・メモリ・アクセス(RDMA)ネットワーキングにより、CONVERGEの優れたスケーリングを実現できました。”
—Convergent Scienceのオーナー兼副社長、Kelly Senecal博士
下記のグラフは、Oracle Cloud Infrastructure上のCONVERGE 3.0で1億7,000万セルの乱流部分予混合燃焼のSandia Flame Dシミュレーションを実行したときに4,000コアまでほぼ理想的な線形に近いスケーリングが行われることを示しています。
数値流体力学(CFD)ワークロードを実行するのに最適な場所を求めていた日産は、Oracle Cloud Infrastructure(OCI)を選びました。日産はデジタル・プロダクト・デザインに基づいて、自動車の燃料効率、信頼性、安全性を向上させる重要な設計上の決定を迅速に下しています。計算集約的でレイテンシに敏感なCFDシミュレーションは、これらの効率を達成するためにきわめて重要です。CFDワークロードをOracle Cloud Infrastructureに移行することで、日産はオンプレミス・レベルのパフォーマンスとクラウドの柔軟性の両方を手にしました。

“当社はマルチクラウド戦略の一環としてOracle Cloud InfrastructureのHPCソリューションを選択し、絶え間ないコスト節約のプレッシャーの下でシミュレーション需要の増加に応えるという課題を解決しました。オラクルは日産に大きなROIをもたらすものと確信しています。”
—日産自動車株式会社、エンジニアリング・システム部ゼネラル・マネージャー、Bing Xu氏

“数値流体力学(CFD)の世界では、製品設計を加速するというプレッシャーが常に存在し、今日のお客様は高忠実度のシミュレーションを数週間ではなく数時間で終わらせたいと考えています。Simcenter STAR-CCM+をOracle Cloud Infrastructureで実行することにより、お客様は高価なハードウェアに投資することなく、忠実度も犠牲にせずに、シミュレーションを迅速かつ簡単にスケールアップできます。従来より低コストでオンプレミスと同じパフォーマンスとスケーリングが手に入り、より的確なエンジニアリング上の意思決定を迅速に行うことができます。”
—Siemens、クラウド・プロダクト・マネージャー、Keith Foston氏
製造業でのデジタルツインによる製品エンジニアリングとテスト
デジタルツインは、物理的な製品を製造する前のプロトタイプの設計とテストをスピードアップする手段としてよく使用されています。メーカーはさまざまな製品ライフサイクル管理(PLM)およびエンジニアリング・シミュレーション・ソフトウェア・パッケージを使用しており、それらはすべてCPUベースまたはGPUベースのコンピューティング・リソースを大量に必要とします。
Altair AcuSolveは、Oracle Cloud InfrastructureのRDMA用クラスター・ネットワークを使用して、ほぼ理想的なレベルのノード数でパフォーマンスを拡張できます。
深層学習とGPUアクセラレーション・コンピューティング
顧客データからInternet of Things(IoT)に至るまで、ビジネス・データの増加はとどまることを知らず、データ・サイエンティストは、従来のオンプレミスITハードウェアより柔軟かつ迅速に深層学習モデルの探索・構築ができる柔軟性を求めています。Oracle Cloudには、深層学習向けのGPUコンピュート・インスタンスや簡単にデプロイできるイメージが用意されており、シングルGPUワークステーションまたはマルチGPUシェイプのクラスターを実行する柔軟性も備えています。
視覚認識、深層学習モデルは、Oracle Cloud Infrastructureのいくつかの機能とイノベーションを活用しています。これには、先日発表された最大8つのGPUを持つNVIDIA A100 Tensor Core GPUコンピュート・インスタンス、動作周波数2.9 GHzで最大64の物理コアを持つ最新の第2世代AMD EPYCプロセッサを搭載したNVLink、高頻度のチェックポインティングに依存するワークロードに適したデータ・アクセス遅延の短いローカルNVMeストレージが含まれます。これらのGPUインスタンスはOracle Cloud Infrastructureで初めてクラスター・ネットワーキングをサポートするもので、この100 GbpsのRDMA相互接続を使用すれば、2マイクロ秒未満のレイテンシと合計1.6 Tbpsの帯域幅でMPIワークロードを実行できます。
“Oracle Cloud Infrastructureは、新しいNVIDIA Tesla Cloudソリューションを初めて世に送り出しました。NVIDIA Tensorコアは約125テラフロップスで動作しますが、消費電力は300ワットほどにすぎません。そのため、従来よりはるかに短時間でモデルとデータセットを実行し、これまでには見い出せなかった、人間にはわからないデータのパターンを明らかにすることができます。当社が機械学習で実行した最初のモデルは、そのモデルの当時本番稼働していたバージョンよりも40%正確でした。実行が完了するまで数時間かかると思っていましたが、驚いたことにわずか数分で終わりました。”
—National Grid ESO、エネルギー・インテリジェンス・マネージャー、James Kelloway氏
高頻度取引
取引アプリケーションなどの金融アプリケーションには、きわめて一貫性が高い「低ジッター」のパフォーマンスを提供する、高性能かつ低レイテンシのインフラストラクチャが必要です。このようなアプリケーションは初期のクラウド・アーキテクチャの設計目標に入っておらず、クラウドへの移行が遅れていました。Oracle Cloud Infrastructureは、このようなアプリケーションに必要な2マイクロ秒未満のクラスター内レイテンシなど、カスタムビルドの高価なオンプレミス・ソリューションに匹敵するパフォーマンス特性を備えており、クラウド上の金融アプリケーションを現実化するうえで必要な結果をもたらします。
“Oracle Cloud Infrastructureは、メッセージ量がどれだけ多くても10 μsレベルの決定論的なレイテンシをサポートできます。低レイテンシに敏感なアプリケーションをOCIにデプロイすることが検討に値するソリューションであることを示す十分な証拠があります。このソリューションの意義は、このサービス・レベルを必要とするサービスが高額な費用のかかるオンサイト・デプロイメントなしで可能になるという点にあります。”
—BJSS、最高技術責任者、Larry Ryan氏
視覚効果レンダリング
高性能コンピューティングは、超大作映画の特殊効果から、テレビ広告、最新のPCゲームやコンソール・ゲームのタイトルまで、現代社会のあちこちで目にする視覚効果を実現する力を与えます。このような視覚効果を開発しているメディア企業は、HPCやGPUのパフォーマンスをオンデマンドで必要としています。OCI上のNVIDIA Quadro仮想ワークステーションは、高価なハイエンド・グラフィックス・ワークステーションに匹敵する性能を持ちながら、1時間あたり数ドルの料金で利用できます。以下に、SPECviewperf 13ベンチマークの結果をいくつか示します。これを実際に試すには、Oracle CloudでGPUをプロビジョニングして利用可能なベンチマークを実行してください。
これがどれだけの性能を持つのかを実感していただくため、NVIDIA P100 GPUを1つ装備したVM.2.1 GPUシェイプでSPECviewperf® 13ベンチマークを実行し、P2000を搭載しているワークステーションと比較しました。SPECviewperf® 13ベンチマークは、プロフェッショナル・アプリケーションに基づいてグラフィックス性能を測定するための世界標準です。

“Oracle Cloud Infrastructureでは、リクエストをキューに入れたり、レンダリングをスケジュールしたりする必要はありません。お客様は必要なときにいつでも無制限の数のマシンを利用でき、不要なときに未使用のキャパシティの料金を支払う必要はありません。”
—GridMarkets、共同創設者、Mark Ross氏

“世界中で、仮想化は企業がこの困難な時期に生産性を維持するのに役立っています。Oracle CloudのQuadro仮想ワークステーションを使用すると、クリエイターや技術プロフェッショナルはどこからでも必要なパフォーマンスに簡単にアクセスできます。”
—NVIDIA、仮想化製品マーケティング担当シニア・ディレクター、Anne Hecht氏
研究
研究者は、Oracle Cloud Infrastructureのスーパーコンピューティング・プラットフォームを介してベアメタルNVIDIA GPU、高性能コンピューティング・インスタンス、低レイテンシのクラスター化ネットワークにアクセスし、大規模な計算を実行するためのクラスターを作成して創薬、ゲノミクス、天気予報、宇宙探査などのさまざまな科学・工学分野の研究を加速できます。オラクルは、Oracle for Researchのようなプログラムを通じてブリストル大学やロンドン大学ロイヤル・ホロウェイ校などの研究機関と緊密に協力し、ワクチン開発や気候変動に対処する高度なソリューションの開発を促進しています。

“私たちは、炭素回収・隔離シナリオをシミュレートし、複雑な環境問題に対処して、世界に意味のある変化をもたらすことができます。オラクルのおかげで、研究室の課題である計算能力の壁を打ち破ることができました。”
—ロンドン大学ロイヤル・ホロウェイ校、Hier-Majumder教授
潜在的な疾患候補を突き止める医学研究は、バーストおよびスケーリング能力があり、研究者のニーズに即座に応えるHPCソリューションによって促進できます。英国のブリストル大学は、Oracle HPCソリューションを使用して医学研究用のイメージング・データを解析しています。

“私たちの目標は、疾患に迅速に対応可能なプラットフォームを作ることであり、それにはテラバイト規模のイメージング・データの作成が必要となります。Oracle Cloudを使用すると、データを複数のプロセッサに分散させることができ、従来のオンプレミス・システムの数分の1の時間で結果が得られます。”
—ブリストル大学、生化学および化学科教授、Imre Berger氏
高性能ストレージ
データ・スループットは、HPCアプリケーションが効率的に動作し、コンピューティング・クラスター全体でデータを共有するために非常に重要です。処理中に大量のデータセットの読み込みや保存を行うには、一貫した線形の応答性によってリクエストに高速かつ確実に応答できるファイル・システムが必要となります。Oracle Cloudには、GlusterFS、BeeGFS、Lustre、IBM Spectrum Scale高性能ファイル・システムなどの複数のHPCファイル・システム・モデルが用意されており、安定した高速なスループットを提供します。

“私のチームは多くのパブリック・クラウドでSAS Gridをテストしてきました。Oracle Cloudのインフラストラクチャのメリットは、SAS Gridに必要なIBM Spectrum Scale共有ファイル・システムへのI/Oスループットを備えている点です。”
—SAS、SASパフォーマンス・ラボ、シニア・マネージャー、Margaret Crevar氏

“オラクルのベアメタル・コンピュート技術とクラスター・ネットワーキング技術により、Oracle Cloud上のBeeGFSの性能は、MPASワークロードにおいて当社のオンプレミスHPCファイル・システムのレイテンシとスループットを上回りました。しかも、発生する料金は非常に安価です。Oracle CloudのRDMAクラスター・ネットワーキングを利用したBeeGFSは、わずか14台のサーバーで最大140 GB/秒のパフォーマンスを達成しました。”
—YellowDog、最高技術責任者、Simon Ponsford氏
Oracle CloudのHPCサービス
ベアメタルHPCコンピュート・インスタンス
高いコア周波数とクラスター・ネットワーキングを持つオラクルのベアメタル・コンピュート・インスタンスは、他のパブリック・クラウドやオンサイト・データセンターよりもパフォーマンスを大幅に向上させます。ベアメタル・コンピュート・インスタンスは分離性と可視性に優れ、卓越した制御が可能です。
クラスター・ネットワーキング
オラクルの標準ベアメタル・サーバーには高速ネットワーク用のデュアル25 Gbpsイーサネットが搭載されており、画期的なバックエンド・ネットワーク・ファブリックはMellanox ConnectX-5、100 Gbpsネットワーク・インターフェイス・カードを使用してRDMA over converged Ethernet(RoCE)v2を提供しています。これにより、オンプレミス・クラスターと同様の低レイテンシ・ネットワークとアプリケーションのスケーラビリティを備えたクラスターを作成できます。
ベアメタルおよびVM上のGPU
Oracle Cloudには、レンダリング、AI、深層学習といったグラフィックスを多用するワークロード向けに、高性能仮想マシンとベアメタルの両方にNVIDIAベースのオプションが用意されています。
Oracle Linux
高性能コンピューティング向けのOracle Linuxは、フルサポートされたオープンで包括的なオペレーティング環境を統合したもので、Red Hat Enterprise Linuxと100%のアプリケーション・バイナリ互換性があります。Oracle Linuxは、Linuxオペレーティング・システム(OS)に加えて仮想化、管理、クラウドネイティブ・コンピューティング・ツールも備えており、単一の製品で高性能コンピューティングの要件を満たします。Oracle CloudのOracle LinuxでHPCを実行すれば、何の犠牲も払わずにパフォーマンスの大幅な向上を手にすることができ、サポート・コストもかかりません。衝突シミュレーションやCFDのワークロードにおいて、Oracle Linuxはシミュレーション時間を4〜6%改善します。
HPCファイル・システム
従来のストレージでは、大量のデータを迅速に処理するパフォーマンス集約的なワークロードに見合った十分なスループットは得られません。このようなニーズを満たすため、Oracle Cloudでは、簡単にデプロイ可能なGlusterFS、BeeGFS、Lustre、IBM Spectrum Scaleなどの高性能なファイル・システムによって最大453 GBpsの総スループットをHPCクラスターに提供できます。
HPCソリューションをすぐに導入可能
自動化された簡単なクラスターのデプロイ
速やかに稼働させるための主要なコンポーネントがすべて含まれているOracle Cloud Marketplaceスタック(Terraformテンプレート)を使用して、クラスターを迅速かつ簡単にデプロイできます。このスタックには、Slurmスケジューラー、OpenMPI、MPI接続のテスト・ツールをインストールする機能があります。
ファイル・システムの簡単なデプロイ
Oracle Cloud Marketplaceスタックを使用して、業界をリードするペタバイト規模の高性能ファイル・サーバーを簡単にデプロイできます。このスタックには、ベスト・プラクティスを基にしたデプロイの複雑さと時間を軽減する自動化が含まれます。数回クリックするだけで、ファイル・システムを15分足らずで稼働させることができます。Oracle Cloud Marketplaceには、BeeGFS、Lustre、GlusterFSに対応するデプロイしやすいスタックに加えて、個々のファイル・システム用のカスタマイズ可能な追加スタックもあります。
データ・サイエンス用VM
Oracle Cloud Infrastructure Virtual Machines for Data Scienceは、より迅速なモデルの構築やビジネス価値の実現を狙いとして事前構成された環境です。これらのVMは、パフォーマンス、セキュリティ、コントロールに優れています。コンピュート自動スケーリングを使用してコンピュート・リソースを必要に応じて拡張でき、不要なときにコンピュート・インスタンスを停止することでコストを抑えることができます。
NVIDIA GPUを搭載し、一般的なIDE、ノートブック、フレームワークがプリインストールされた仮想マシンを15分足らずで稼働させることができます。Oracle Cloud Infrastructure VMs for Data Scienceには、テストと探索のための基本的なサンプル・データとコードが含まれています。
Oracle Cloud HPCの価格性能
オラクルのHPCインスタンスは、高速なシングル・スレッド・パフォーマンスとレイテンシのきわめて短いネットワークが要求される計算量の多いワークロード向けに設計されています。すべてのHPCインスタンスに、非仮想化のベアメタルRDMAネットワークを利用した独自のダイレクト・メモリ相互接続ネットワークが搭載されています。さらに、高周波プロセッサ、高速かつ高密度のローカル・ストレージ、数万コアのクラスター全体で2マイクロ秒未満のレイテンシを実現するRDMAクラスター・ネットワークも備えています。AWSはこのアーキテクチャを提供しておらず、最も近いソリューションであるC5nははるかに高額です。
Oracle Cloud Infrastructure BM.HPC2.36 | AWS c5n.metal | |
---|---|---|
定価 | $2.70 | $3.888(米国東部) |
ストレージ | ローカルNVME SSD | ローカルNVMe SSDなし |
メモリ | 384 GB | 192 GB |
ネットワーキング | RDMA | RDMAなし |
パフォーマンスSLA | あり | なし |
ベンチマーク | ||
SPECrate 2017 Integer | 238 | 237 |
SPECrate 2017 Floating Point | 206 | 206 |
ストリーム(MB/秒) | 146,984 | 140,833 |
概要1 2 3 | RDMAとパフォーマンス保証を備え、低コストで優れたパフォーマンスを実現 | 料金は44%高額、ローカルSSDストレージなし、RAM容量は半分、RDMAやパフォーマンスSLAの提供もなし |

“Rocky DEMはOracle Cloud Infrastructureと連携して、スケーラブルなエクスペリエンスをオンプレミス・クラスターと同等のパフォーマンスでお客様に提供しています。さらに、ハイパーバイザーのオーバーヘッドがないベアメタルNVIDIA GPUサーバーは、合理的な時間内で非常に大きな問題に取り組むのに役立ちます。”
—ESSSの副社長、Marcus Reis氏