Oracle Cloud HPC-Lösungen vereinen die Performance von On-Premises-Lösungen mit der Elastizität und den verbrauchsabhängigen Kosten der Cloud und bieten Kunden die Möglichkeit, von kostenintensiven On-Premises-Systemen zu migrieren oder diese zu ergänzen. Die Oracle Cloud Infrastructure HPC-Plattform umfasst Bare Metal-Compute-Instanzen, Cluster-Netzwerke mit geringer Latenz für RDMA, leistungsstarke Speicherlösungen und Dateisysteme, Isolation des Netzwerkverkehrs und die Tools, die Sie zum nahtlosen Automatisieren und Ausführen von Jobs in der Cloud benötigen. Die Cloud-basierte Infrastruktur von Oracle ermöglicht es Kunden, komplexe technische Probleme schneller zu lösen – von Crash-Simulationen in der Automobilindustrie über seismische Analysen für Öl- und Gasunternehmen bis hin zum Rendern von Spezialeffekten für Medienunternehmen.
Lösungen nach Branche
Oracle hat die Infrastruktur und Dienste in die Cloud integriert, um die Anforderungen von Unternehmenskunden zu erfüllen. Diese Kunden verlassen sich üblicherweise auf On-Premises-Systeme, um zeitnahe Ergebnisse zu erzielen. Mit Oracle vermeiden Kunden lange Wartezeiten und potenzielle Verzögerungen beim Design. Stattdessen können sie sich darauf konzentrieren, die Entwicklung von Produkten neu zu definieren, Risiken zu bewerten, Erfahrungen zu liefern und ihre Branchen zu revolutionieren.
- Fertigung — Digitale Zwillinge, Computer Aided Engineering, Computergestützte Strömungssimulation (CFD, Computational Fluid Dynamics)
- Finanzen — Handelsplattformen, Risikomodellierung
- Medien — Rendering visueller Effekte
- Branchenübergreifend — KI, Machine Learning, Deep Learning
- Forschung — Medizinische Studien, Wirkstoffentdeckung, Genomik, Klimawandel
Computergestützte Strömungssimulation in der Fertigung
Bild mit freundlicher Genehmigung von AltairComputergestützte Strömungssimulation (CFD) ist ein gängiger Workload, bei dem die Bewegung von Luft und Flüssigkeit simuliert wird, um die Produktentwicklung zu vereinfachen und zu beschleunigen. Im Automobilsektor hilft es Herstellern beispielsweise, den Luftstrom im Fahrzeuginnenraum, die Motoröldynamik und den Luftstrom um das Auto herum zu simulieren, um die Kraftstoffeffizienz zu verbessern. Es handelt sich um einen eng gekoppelten MPI-basierten Workload, der von der 100-Gbit/s-Cluster-Vernetzung von Oracle, unseren Intel Prozessor-basierten Hochfrequenz-Compute-Instanzen und den neuesten NVIDIA GPUs profitiert. Oracle HPC ist 44 % günstiger als AWS Angebote.
Source: Die Open CAE Society of Japan

“Wir freuen uns, mit Oracle zusammenzuarbeiten, um unseren Kunden CONVERGE auf Oracle Cloud Infrastructure anzubieten. Mit den Bare Metal-HPC-Shapes von Oracle Cloud Infrastructure und dem RDMA-Netzwerk (Remote Direct Memory Access) mit geringer Latenz konnten wir eine hervorragende Skalierung für CONVERGE erzielen.”
– Dr. Kelly Senecal, Inhaberin und Vizepräsidentin von Convergent Science
Die folgende Grafik zeigt, dass CONVERGE 3.0 auf Oracle Cloud Infrastructure eine nahezu ideale und lineare Skalierung auf 4.000 Kerne für eine turbulente, teilweise vorgemischte Sandia Flame D-Simulation mit 170 Millionen Zellen bietet.
Nissan entschied sich für Oracle Cloud Infrastructure (OCI) als besten Ort für die Ausführung seiner CFD-Workloads (Computational Fluid Dynamics). Das Unternehmen Nissan verlässt sich auf digitales Produktdesign, um schnelle und wichtige Designentscheidungen zu treffen und die Kraftstoffeffizienz, Zuverlässigkeit und Sicherheit seiner Autos zu verbessern. Rechenintensive und latenzsensitive CFD-Simulationen tragen entscheidend zur Erzielung dieser Effizienz bei. Durch die Migration dieser Workloads in Oracle Cloud Infrastructure erhält Nissan Performance auf On-Premises-Niveau und die Flexibilität der Cloud.

“Wir haben die HPC-Lösungen von Oracle Cloud Infrastructure als Teil unserer Multi-Cloud-Strategie ausgewählt, um den Herausforderungen eines erhöhten Simulationsbedarfs unter dem konstantem Druck, Kosten einzusparen, gerecht zu werden. Ich glaube, dass Oracle Nissan einen signifikanten ROI bringen wird.”
– Bing Xu, General Manager, Engineering Systems Department, Nissan Motor Co, Ltd.

“In der Welt der computergestützten Strömungssimulation besteht ein ständiger Druck, die Geschwindigkeit des Produktdesigns zu steigern. Heute wollen unsere Kunden High-Fidelity-Simulationen in Stunden, nicht in Wochen. Durch die Ausführung von Simcenter STAR-CCM + auf Oracle Cloud Infrastructure konnten unsere Kunden ihre Simulationen schnell und einfach ohne kostspielige Hardware-Investitionen oder Beeinträchtigung der Wiedergabetreue skalieren. Unsere Kunden erhalten die gleiche Performance und Skalierung wie On-Premises, aber zu geringeren Kosten, sodass sie schneller bessere technische Entscheidungen treffen können.”
– Keith Foston, Cloud Product Manager, Siemens
Digital Twin-Produktentwicklung und -Tests in der Fertigung
Vor der Herstellung physischer Produkte werden häufig digitale Zwillinge verwendet, um das Design und Testen von Prototypen zu beschleunigen. Hersteller verwenden eine Vielzahl von Product Lifecycle Management (PLM)- und Engineering-Simulationssoftwarepaketen, die alle erhebliche CPU- oder GPU-basierte Rechenressourcen erfordern.
Mithilfe unserer Cluster-Netzwerke für RDMA ist Altair AcuSolve in der Lage, die Performance mit einer nahezu idealen Knotenzahl in Oracle Cloud Infrastructure zu skalieren.
Deep Learning und GPU-beschleunigtes Computing
Aufgrund der explosionsartigen Zunahme von Geschäftsdaten, die von Kundendaten bis zum Internet of Things (IoT) reichen, benötigen Datenanalysten die Flexibilität, Deep-Learning-Modelle schnell und flexibler zu erforschen und zu erstellen, als dies mit herkömmlicher On-Premises-IT-Hardware möglich wäre. Oracle Cloud bietet GPU-Recheninstanzen für Deep Learning, einfach bereitzustellende Images und die Flexibilität, eine einzelne GPU-Workstation oder einen einzelnen Cluster mit mehreren GPU-Shapes auszuführen.
Deep-Learning-Modelle mit visueller Erkennung profitieren von verschiedenen Oracle Cloud Infrastructure-Funktionen und -Innovationen. Dazu gehören angekündigte NVIDIA A100 Tensor Core-GPU-Recheninstanzen mit bis zu 8 GPUs und NVLink mit den neuesten AMD EPYC-Prozessoren der 2. Generation mit 2,9 GHz und bis zu 64 physischen Kernen sowie lokalem NVMe-Storage für den Datenzugriff mit geringer Latenz für Workloads, die auf intensiver Checkpoint-Ausführung beruhen. Diese GPU-Instanzen unterstützen als Erstes die Cluster-Vernetzung in der Oracle Cloud Infrastructure, unsere 100-Gbit/s-RDMA-Verbindung, mit der Kunden MPI-Workloads mit Latenzen von weniger als 2 Mikrosekunden und einer kombinierten Bandbreite von 1,6 Tbit/s ausführen können.
“Oracle Cloud Infrastructure integrierte als Erstes eine neue NVIDIA Tesla Cloud-Lösung. Die Tensor Cores führen ungefähr 125 Teraflops aus, benötigen jedoch nur ungefähr eine Leistung von 300 Watt. Daher können wir Modelle und Datensätze sehr viel früher als mit allem, was uns vorher zur Verfügung stand, ausführen. Wir erkennen nun Datenmuster, die wir vorher nicht sehen konnten und die für den Menschen nicht offenkundig sind. Das erste Modell, das wir mit Machine Learning ausführten, war um 40 % genauer als die Version des Modells, das zu diesem Zeitpunkt in der Produktion war. Wir hatten erwartet, dass es Stunden dauern würde, aber es dauerte nur Minuten.”
– James Kelloway, Energy Intelligence Manager, National Grid ESO
Hochfrequenzhandel
Finanzanwendungen, einschließlich Handelsanwendungen, erfordern eine leistungsstarke Infrastruktur mit geringer Latenz, die eine sehr konsistente Performance mit “geringem Jitter” bietet. Diese Anwendungen waren kein Designziel früher Cloud-Architekturen und sie haben sich nur langsam in die Cloud verlagert. Oracle Cloud Infrastructure bietet die Performance-Merkmale, wie z. B. die für diese Anwendungen erforderliche Latenz im Cluster von weniger als 2 Mikrosekunden. Diese konkurriert mit kundenspezifischen und teuren On-Premises-Lösungen und liefert die Ergebnisse, die Kunden benötigen, um diese Anwendungen zu aktivieren.
“Oracle Cloud Infrastructure kann deterministische Latenzen von 10 μs bei sehr hohen Nachrichtenvolumina unterstützen. Es gibt ausreichend Nachweise, die es rechtfertigen, die Bereitstellung vertraulicher Anwendungen mit geringer Latenz für OCI zu untersuchen. Dies ist wichtig, da Dienste, die dieses Servicelevel erfordern, auf diese Weise teure Bereitstellungen vor Ort vermeiden.”
– Larry Ryan, Chief Technical Officer, BJSS
Rendering visueller Effekte
High Performance Computing bietet die Leistung für die allgegenwärtigen visuellen Effekte von heute. Von den Spezialeffekten Ihres Lieblings-Blockbusters bis hin zu Fernsehwerbung und den neuesten PC- und Konsolenspieltiteln. All diese Effekte werden von Medienunternehmen entwickelt, die jederzeit abrufbare HPC- und GPU-Performance benötigen. Die auf der Performance von OCI aufbauende NVIDIA Quadro Virtual Workstation entspricht teuren High-End-Grafik-Workstations. Mit Oracle können Sie jedoch für ein paar Euro pro Stunde auf diese Performance zugreifen. Im Folgenden zeigen wir einige der SPECviewperf 13-Benchmark-Ergebnisse. Probieren Sie dies selbst aus indem Sie eine GPU in der Oracle Cloud bereitstellen und den verfügbaren Benchmark ausführen.
Um Nutzer einen Eindruck davon zu vermitteln, wie dies funktioniert, haben wir den SPECviewperf® 13-Benchmark für unser VM.2.1 GPU-Shape ausgeführt, das eine NVIDIA P100-GPU bereitstellt, und es mit einer P2000-Workstation verglichen. Der SPECviewperf® 13-Benchmark ist der weltweite Standard zum Messen der Grafik-Performance basierend auf professionellen Anwendungen.

“Mit Oracle Cloud Infrastructure müssen Anforderungen nicht in die Warteschlange gestellt oder Renderings geplant werden. Unsere Kunden können jederzeit auf eine unbegrenzte Anzahl von Maschinen zugreifen. Wenn sie nicht darauf zugreifen, müssen unsere Kunden nicht für ungenutzte Kapazität bezahlen.”
– Mark Ross, Mitbegründer von GridMarkets

“Virtualisierung hilft Unternehmen weltweit, in diesen herausfordernden Zeiten produktiv zu bleiben. Mit Quadro Virtual Workstations auf Oracle Cloud können kreative und technische Profis problemlos auf die Performance zugreifen, die sie benötigen, um überall arbeiten zu können.”
– Anne Hecht, Senior Director für Virtualisierungsproduktmarketing, NVIDIA
Forschung
Die Supercomputing-Plattform von Oracle Cloud Infrastructure bietet Forschern Zugriff auf Bare Metal NVIDIA GPUs, High Performance Computing-Instanzen und ein Cluster-Netzwerk mit geringer Latenz. Forscher können Cluster für die Durchführung umfangreicher Berechnungen erstellen, um die Forschung in verschiedenen Bereichen der Wissenschaft und Technik wie der Wirkstoffentdeckung, der Genomik, der Wettervorhersage, der Weltraumforschung und mehr zu beschleunigen. Über Programme wie Oracle for Research arbeitet Oracle eng mit Forschungseinrichtungen wie der University of Bristol und der Royal Holloway University of London zusammen, um die Entwicklung von Impfstoffen und fortschrittlichen Lösungen zur Bekämpfung des Klimawandels zu beschleunigen.

“Wir können Sequestrierungsszenarien für die Kohlenstoffabscheidung simulieren, komplexe Umweltprobleme angehen und bedeutende Veränderungen in der Welt vorantreiben. Oracle hat uns geholfen, die Grenze der Rechenleistung im Labor zu überwinden.&
– Professor Hier-Majumder, Royal Holloway, University of London.
Die Beschleunigung der medizinischen Forschung, um potenzielle Kandidaten für Krankheiten zu finden, kann mit HPC-Lösungen erreicht werden, die gebündelt und skaliert werden sowie auf die Bedürfnisse von Forschern reagieren können. Die University of Bristol in Großbritannien verwendet Oracle HPC-Lösungen, um Bildgebungsdaten für medizinische Forschung zu analysieren.

“Unser Ziel ist das Entwickeln einer Plattform, mit der wir schnell auf Krankheiten reagieren können. Dabei werden Terabyte an Bilddaten erstellt. Mit der Oracle Cloud können wir die Daten auf mehrere Prozessoren verteilen und Ergebnisse in einem Bruchteil der Zeit verglichen mit einem herkömmlichen On-Premise-System erzielen.”
– Imre Berger, Professor für Biochemie und Chemie an der University of Bristol
Leistungsstarker Speicher
Der Datendurchsatz ist für HPC-Anwendungen äußerst wichtig, um effizient zu arbeiten und den Datenaustausch im gesamten Computecluster zu ermöglichen. Das Laden und Speichern großer Datensätze während der Verarbeitung erfordert ein Dateisystem, das extrem schnell und zuverlässig mit konsistenter, linearer Reaktionsfähigkeit auf Anfragen reagieren kann. Oracle Cloud bietet mehrere HPC-Dateisystemmodelle, einschließlich GlusterFS-, BeeGFS-, Lustre- und IBM Spectrum Scale-Hochleistungs-Dateisystemen mit stabilem Hochgeschwindigkeitsdurchsatz.

“Mein Team hat SAS Grid in vielen Public Clouds getestet. Wir freuen uns, sagen zu können, dass die Infrastruktur der Oracle Cloud den E/A-Durchsatz für das gemeinsam genutzte IBM Spectrum Scale-Dateisystem bietet, der für SAS Grid benötigt wird.”
– Margaret Crevar, Senior Manager, SAS Performance Lab, SAS

“Dank der Bare Metal-Computing- und Cluster-Netzwerktechnologien von Oracle konnte BeeGFS in der Oracle Cloud die Latenz und den Durchsatz unseres On-Premises-HPC-Dateisystems für MPAS-Workloads übertreffen – und das zu einem sehr niedrigen Preis. Durch Verwendung der RDMA-Cluster-Vernetzung von Oracle Cloud erzielt BeeGFS mit nur 14 Servern eine Performance von bis zu 140 GB/s.”
– Simon Ponsford, Chief Technical Officer, YellowDog
HPC-Services in der Oracle Cloud
Bare Metal-HPC-Compute-Instanzen
Hohe Kernfrequenzen und die Cluster-Vernetzung ermöglichen den Bare Metal-Compute-Instanzen von Oracle signifikante Performance-Verbesserungen gegenüber anderen Public Clouds und Rechenzentren vor Ort. Bare Metal-Compute-Instanzen bieten Kunden ein außergewöhnliches Maß an Isolation, Visibilität und Kontrolle.
Cluster-Vernetzung
Während unsere Bare Metal-Standardserver 25 Gbit/s-Dual Ethernet für schnelle Netzwerke umfassen, nutzt das bahnbrechende Oracle Back-End-Netzwerk die Mellanox ConnectX-5-Netzwerk-Schnittstellenkarten mit 100 Gbit/s für die Bereitstellung von RDMA über Converged Ethernet (RoCE) v2. Dadurch werden Cluster mit der Netzwerk- und Anwendungsskalierbarkeit mit geringer Latenz erstellt, die Sie von Ihren On-Premises-Clustern erwarten.
GPUs auf Bare Metal und VMs
Oracle Cloud verfügt über leistungsstarke virtuelle Maschinen und Bare Metal-NVIDIA-basierte Optionen für grafikintensive Workloads für Rendering, KI und Deep-Learning-Workloads.
Oracle Linux
Oracle Linux für High Performance Computing kombiniert eine vollständig unterstützte, offene und komplette Betriebsumgebung, die zu 100 % mit der Anwendung Red Hat Enterprise Linux binär kompatibel ist. Oracle Linux stellt Virtualisierung, Management und Cloud-native Computing-Tools – zusammen mit dem Linux Betriebssystem – in einem einzigen Angebot bereit, das die hohen High Performance Computing-Anforderungen erfüllt. Kunden, die HPC unter Oracle Linux in der Oracle Cloud ausführen, erleben beeindruckende Performance-Gewinne ohne Einbußen oder Supportkosten. Dank Crash-Simulationen und CFD-Workloads bietet Oracle Linux eine Verbesserung der Simulationszeiten um 4–6 %.
HPC-Dateisysteme
Herkömmlicher Speicher bietet nicht genügend Durchsatz für leistungsintensive Workloads, die schnell große Datenmengen verarbeiten. Um diesen Anforderungen gerecht zu werden, erleichtert Oracle die Bereitstellung von GlusterFS-, BeeGFS-, Lustre- und IBM Spectrum Scale-Hochleistungs-Dateisystemen, die einen Gesamtdurchsatz von bis zu 453 Gbit/s für HPC-Cluster liefern können.
Bereit für die Bereitstellung von HPC-Lösungen?
Einfache, automatisierte Clusterbereitstellung
Stellen Sie Cluster schnell und einfach mit einem Oracle Cloud Marketplace-Stack (Terraform-Vorlage) bereit, der alle Schlüsselkomponenten enthält, um schnell einsatzbereit zu sein. Der Stack bietet die Möglichkeit, den Slurm Scheduler, OpenMPI und Tools zum Testen der MPI-Konnektivität zu installieren.
Einfache Bereitstellung des Dateisystems
Oracle erleichtert die Bereitstellung branchenführender Hochleistungs-Dateiserver im Petabyte-Umfang mit Oracle Cloud Marketplace-Stacks, die eine auf Best Practices basierende Automatisierung umfassen. Auf diese Weise werden die Komplexität und Zeit bis zur Bereitstellung reduziert. Mit nur wenigen Klicks sind Dateisysteme in maximal 15 Minuten betriebsbereit. Oracle Cloud Marketplace enthält einen einfach zu implementierenden Stack, der sowohl BeeGFS, Lustre und GlusterFS abdeckt als auch weitere anpassbare Stacks für jedes einzelne Dateisystem.
VMs für Data Science
Virtuelle Maschinen mit Oracle Cloud Infrastructure für Data Science sind vorkonfigurierte Umgebungen, mit denen Sie Modelle erstellen und schneller geschäftlichen Nutzen erzielen können. Sie bieten außergewöhnliche Performance, Sicherheit und Kontrolle. Sie können Ihre Rechenressourcen nach Bedarf mithilfe der automatischen Compute-Skalierung erweitern und die Kosten unter Kontrolle halten, indem Sie Compute-Instanzen stoppen, wenn sie nicht benötigt werden.
Mit vorinstallierten gängigen IDEs, Notebooks und Frameworks kann eine virtuelle Maschine mit einer NVIDIA GPU in weniger als 15 Minuten betriebsbereit sein. Oracle Cloud Infrastructure VMs für Data Science umfassen grundlegende Beispieldaten und Code zum Testen und Erkunden.
Preis-Leistungsverhältnis von Oracle Cloud HPC
Wir haben unsere HPC-Instanzen für die rechenintensivsten Workloads entwickelt, die die schnellste Single-Thread- Performance und das Netzwerk mit der niedrigsten Latenz erfordern. Alle HPC-Instanzen verfügen über ein eindeutiges Direct Memory-Verbindungsnetzwerk, das von einem nicht virtualisierten Bare Metal-RDMA-Netzwerk unterstützt wird. Wir bieten hochfrequente Prozessoren, schnellen und dichten lokalen Speicher und ein RDMA-Clusternetzwerk mit einer <Latenz von 2 Mikrosekunden in Clustern von Zehntausenden von Kernen. AWS bietet diese Architektur nicht, und die nächstbeste Lösung, C5n, ist erheblich teurer.
Oracle Cloud Infrastructure BM.HPC2.36 | AWS c5n.metal | |
---|---|---|
Listenpreis | $2.70 | 3,888 USD (Osten der USA) |
Speicher | Lokale NVMe-SSDs | Keine lokale NVMe-SSD |
Speicher | 384 GB | 192 GB |
Networking | RDMA | Kein RDMA |
Performance-SLA | Ja | Nein |
Benchmarks | ||
SPECrate 2017 Integer | 238 | 237 |
SPECrate 2017 Floating Point | 206 | 206 |
Stream (MB/s) | 146,984 | 140,833 |
Zusammenfassung1 2 3 | Bessere Performance bei geringeren Kosten mit RDMA- und Performance-Garantie | 44 % teurer, kein lokaler SSD Storage, halb so viel RAM, keine RDMA und keine Performance-SLA |

“Oracle Cloud Infrastructure und Rocky DEM haben zusammengearbeitet, um ein skalierbares Kundenerlebnis mit einer Performance zu bieten, die der von On-Premises-Clustern ähnelt. Dank der Bare Metal-NVIDIA GPU-Server ohne Hypervisor-Overhead können außerdem sehr große Probleme in einem angemessenen Zeitraum gelöst werden.”
– Marcus Reis, Vice President von ESSS