Oracle Cloud Infrastructure (OCI) Compute bietet Bare-Metal- und Virtual-Machine-Instanzen, die von NVIDIA-GPUs für eine Vielzahl von Anwendungsfällen unterstützt werden, darunter Mainstream-Grafiken und -Videos sowie die anspruchsvollsten KI-Trainings- und HPC-Workloads. OCI zeichnet sich sowohl bei den Trainingszeiten als auch bei den Kosten durch seine ultraniedrige Latenz und der nahezu linearen Netzwerkperformance aus.
Die RDMA-Kommunikation (Remote Direct Memory Access) zwischen Instanzen unterstützt große GPU-Cluster mit 1.600 Gb/s Bandbreite und extrem niedriger Latenz.
OCI bietet den größten Nutzen und die höchste Performance für Bare-Metal- und VM-Compute-Instanzen, die von diesen NVIDIA-GPUs unterstützt werden: A100, A10, V100 und P100.
Mit Bare-Metal-Compute-Instanzen können Kunden hochleistungsfähige, latenzempfindliche und spezialisierte Workloads direkt auf Serverhardware ausführen – genau so, wie sie es On-Premises tun würden.
Das auf RDMA basierende Cluster-Networking von Oracle mit extrem niedriger Latenz bietet eine Latenz im Mikrosekundenbereich. Ohne Leistungseinbußen können Kunden mehr als 500 GPUs in einem Cluster hosten.
Passen Sie Ihre Workload optimal an verschiedene Instanztypen an.
Wählen Sie für VMs aus den NVIDIA Ampere-, Volta- und Pascal-GPUs mit 1 bis 4 Cores, 16 bis 64 GB GPU-Speicher und bis zu 480 GB lokal angeschlossenem Flash-Speicher aus.
Clustern Sie Bare-Metal-Instanzen für HPC und KI-Training mit NVIDIA A100 Tensor Core-GPUs mit 640 GB GPU-Speicher pro Knoten.
Verhindern Sie mit isolierter Netzwerkvirtualisierung Angriffe auf Kundenmandanten. Ein grundlegendes Element der sicherheitsorientierten Architektur der Oracle Cloud Infrastructure ist, dass sie Malware mit einer speziell entwickelten SmartNIC aufhält sowie das Netzwerk isoliert und virtualisiert.
Mithilfe einfach zu definierender Richtlinien, die an logischen Benutzer- und Ressourcengruppen ausgerichtet sind, können Sie nicht nur kontrollieren, wer Zugriff auf die Ressourcen der Oracle Cloud Infrastructure hat. Sie können auch festlegen, auf welche Ressourcen zugegriffen werden darf und über welche Zugriffsart das geschehen soll. Kunden können Identitäten und Zugriffe verwalten, indem sie dazu vorhandene Organisationshierarchien und Verbundverzeichnisdienste nutzen wie Microsoft, Okta oder andere SAML-Verzeichnisanbieter.
Reduzieren Sie das Risiko Firmware-basierter Angriffe auf Kundenmandanten der Oracle Cloud Infrastructure durch eine vertrauenswürdige maßgeschneiderte und hardwarebasierte Technologie, mit der die Firmware jedes Mal gelöscht und neu installiert werden kann, wenn ein neuer Server bereitgestellt oder ein neues Kundenmandat eingerichtet wird.
Schützen Sie Anwendungen vor böswilligem oder unerwünschtem Internetverkehr mit einer cloudbasierten und PCI-kompatiblen globalen Webanwendungs-Firewall (WAF). Durch die Kombination von Bedrohungsinformationen mit der konsistenten Durchsetzung von Regeln stärkt dieser Dienst Ihre Abwehr und schützt mit dem Internet verbundene Anwendungsserver.
Verwalten und kontrollieren Sie zentral die Verschlüsselungsschlüssel und geheimen Anmeldeinformationen, die zum Schutz von Unternehmensdaten und des Ressourcenzugriffs verwendet werden. Die Sicherheit für beide wird in einem FIPS (Federal Information Processing Standards) 140-2 Level 3-zertifiziertem Hardwaresicherheitsmodul (HSM) gespeichert.
Benutzer können die Berechtigungen für einzelne Schlüssel und Vaults mit OCI Identity and Access Management steuern und Änderungen des Lebenszyklus von Schlüsseln mit OCI Audit überwachen, um den erweiterten Compliance-Anforderungen gerecht zu werden.
Oracle unterstützt eine umfassende Auswahl von Betriebssystemen, die auf Microsoft Windows Server und Enterprise Linux basieren wie zum Beispiel Oracle Linux, CentOS, Ubuntu und viele andere. Oracle Autonomous Linux ist eine kostenlose, autonome Betriebssystemumgebung, die Komplexität und menschliche Fehler reduziert sowie Kosteneinsparungen, Sicherheit und die Verfügbarkeit für Oracle Cloud-Kunden erhöht.
Mit dem OCI OS Management-Service können Kunden Richtlinien für automatisierte Updates und Patches für ihre Betriebssystemumgebung festlegen.
Kunden können ihre eigenen Betriebssysteme und Hypervisors auf Oracle Compute-Instanzen ausführen und über Konfigurationsgrößen hinweg dasselbe Image verwenden.
Der Oracle Cloud Marketplace bietet Software und Disk-Images für Data Science, Analysen, künstliche Intelligenz (KI) und maschinelle Lernmodelle (ML), um Kunden die Möglichkeit zu geben, schnell Erkenntnisse aus ihren Daten zu gewinnen.
Greifen Sie auf Hunderte von GPU-optimierten Anwendungen für Machine Learning, Deep Learning und High-Performance-Computing zu, die eine breite Palette von Branchen und Workloads abdecken. Weitere Informationen.
Mit NVIDIA RTX Virtual Workstation auf Oracle Cloud können Kunden hohe Workstation-Leistung überall dort bereitstellen, wo Mitarbeiter sie benötigen.
Entwickler, die Anwendungen mithilfe von Containern erstellen, können einen hochverfügbaren, von Oracle verwalteten privaten Container-Registrierungsdienst zum Speichern und Teilen von Container-Images nutzen. Bewegen Sie Docker-Images per Push und Pull mit der Docker V2 API und der Standard-Docker-Befehlszeilenschnittstelle (CLI) in die Registrierung oder aus ihr heraus. Images können direkt als Teil einer Kubernetes-Bereitstellungsstrategie verwendet werden.
Functions as a Service (FaaS) für Entwickler zum Ausführen von Anwendungen ohne Server, die in Oracle Cloud Infrastructure, Oracle Cloud-Anwendungen und Dienste von Drittanbietern integriert sind. Sichern Sie sich Effizienz für Entwickler und Zugang zur Community des Open Source Fn-Projekts.
Trainieren Sie KI-Modelle mit OCI Data Science, Bare-Metal-Instanzen und Cluster-Netzwerken basierend auf RDMA und NVIDIA-GPUs.
OCI Compute auf Basis von NVIDIA-GPUs bietet eine konsistent hohe Performance für VDI.
OCI ermöglicht computergestütztes Engineering und Computational Fluid Dynamics für schnelle Vorhersagen der aerodynamischen Eigenschaften von Objekten.
„Mit der Skalierbarkeit und Rechenleistung der OCI- und NVIDIA-Technologie trainieren wir ein neuronales Netzwerk, um jede existierende Softwareanwendung, Website und API zu nutzen – aufbauend auf den Funktionen, die Softwarehersteller bereits geschaffen haben.“
David Luan, CEO
Adept
„Mit Oracle Cloud Infrastructure können wir Zehntausende Modelle verarbeiten, um unsere Algorithmen enorm schnell zu trainieren. Es ist eine der besten Plattformen der Welt für die Art der Arbeit, die wir tun.“
James Kelloway, Energy Intelligence Manager
National Grid ESO
„Wir sehen diese Beziehung zu OCI als langfristig an. Wir freuen uns, die GPUs nutzen und damit unsere nächste Generation von Sprach-KI trainieren zu können. Wir glauben, dass OCI uns in Bezug auf zukünftiges Wachstum einiges bieten wird.“
James Hom, Cofounder und Vice President of Products
SoundHound
„Mit NVIDIA-GPUs, die auf OCI-Bare-Metal-Instanzen ausgeführt werden, erlebt Twist erhebliche Performanceverbesserungen bei seinen ParaFold- und ESMFold-KI-Modellen.“
„Oracle Cloud Infrastructure ist eine Hyperscaler-Cloud der Spitzenklasse, die XaaS-Compute- und Anwendungsservices für Oracle Kunden bereitstellt und viel mehr bietet, als Sie vielleicht erwarten, einschließlich KI/ML- und GPU-Workloads.“
Joel Kaufman
Senior Technical Marketing Manager, WEKA
„Seit der Migration von AWS haben wir unseren Datenbestand vervierfacht und gleichzeitig unsere Kosten um 40 % gesenkt. Wir nutzen auf OCI 33 % weniger GPU-Compute-Kapazität als auf AWS.“
Suren Gounder, CEO
Tango Eye
„Die Integration mit der Cloud-Plattform von Oracle bietet uns hochmoderne GPU-Rechenressourcen, erstklassige Sicherheit und hochflexible VMware-Umgebungen. Letztendlich führt dies zu einer verbesserten Produktivität, einer optimierten Ressourcennutzung und einer schnelleren Markteinführung.“
Sam Mahalingam, Chief Technology Officer
Altair
Die als virtuelle Maschinen und Bare Metal verfügbaren Instanzen bieten Flexibilität und hohe Leistung.
Instanzvorlage |
GPUs |
Architektur |
GPU-Interconnect |
Grafikspeicher |
GPU-Kerne |
CPU-Zwischenspeicher |
Speicher |
Netzwerk |
GPU-Preis pro Stunde (US-Dollar) |
Server-Preis pro Stunde (US-Dollar) |
KI-Training im großen Maßstab | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
BM.GPU.GM4.8 |
8x NVIDIA A100 80 GB Tensor Core |
Ampere |
NVIDIA NVLINK |
640 GB |
128 |
2,048 GB |
4x 6,8 TB NVMe |
8x2x100 Gbit/s RDMA* |
32 USD | |
BM.GPU4.8 |
8x NVIDIA A100 40 GB Tensor Core |
Ampere |
NVIDIA NVLINK |
320 GB |
64 |
2,048 GB |
4x 6,8 TB NVMe |
8x2x100 Gbit/s RDMA* |
24,40 USD | |
KI-Training im kleinen Maßstab, Inferenz, Streaming, Gaming, VDI | ||||||||||
VM.GPU.GU1.1 (neu) |
1x NVIDIA A10 Tensor Core |
Ampere |
N/A |
24 GB |
15 |
240 GB |
Blockspeicher |
24 Gbit/s |
2 USD |
|
VM.GPU.GU1.2 (neu) |
2x NVIDIA A10 Tensor Core |
Ampere |
N/A |
48 GB |
30 |
480 GB |
Blockspeicher |
48 Gbit/s |
4 USD |
|
BM.GPU.GU1.4 |
4x NVIDIA A10 Tensor Core |
Ampere |
N/A |
96 GB |
64 |
1,024 GB |
2x 3,84 TB NVMe |
2x 50 Gbit/s |
8 USD |
|
VM.GPU3.1 |
1 x NVIDIA V100 Tensor Core |
Volta |
N/A |
16 GB |
6 |
90 GB |
Blockspeicher |
4 Gbit/s |
2,95 USD |
|
VM.GPU3.2 |
2 x NVIDIA V100 Tensor Core |
Volta |
NVIDIA NVLINK |
32 GB |
12 |
180 GB |
Blockspeicher |
8 Gbit/s |
5,90 USD |
|
VM.GPU3.4 |
4 x NVIDIA V100 Tensor Core |
Volta |
NVIDIA NVLINK |
64 GB |
24 |
360 GB |
Blockspeicher |
25 Gbit/s |
11,80 USD |
|
BM.GPU3.8 |
8 x NVIDIA V100 Tensor Core |
Volta |
NVIDIA NVLINK |
128 GB |
52 |
768 GB |
4x 1,92 TB NVMe |
2x 25 Gbit/s |
23,60 USD |
|
VM.GPU2.1 |
1 x NVIDIA P100 |
Pascal |
N/A |
16 GB |
12 |
72 GB |
Blockspeicher |
8 Gbit/s |
1,28 USD |
|
BM.GPU2.2 |
2x NVIDIA P100 |
Pascal |
N/A |
32 GB |
28 |
192 GB |
Blockspeicher |
2x 25 Gbit/s |
2,55 USD |
NVIDIA GPU Cloud Machine Image on OCI ist zertifiziert und wird von NVIDIA AI Enterprise, einer vollständig verwalteten, sicheren und Cloud-nativen Suite von KI- und Datenanalysesoftware, unterstützt.
Jag Brar, Vice President und Distinguished Engineer
Pradeep Vincent, Senior Vice President und OCI Chief Technical Architect
OCI-Architekten erklären, wie sie RDMA-Netzwerke angewendet haben, die NVIDIA ConnectX RDMA-Netzwerkschnittstellenkarten verwenden, um große RDMA-Supercluster zur Unterstützung von Zehntausenden von GPUs aufzubauen.
Vollständigen Beitrag lesenErstellen, testen und implementieren Sie Anwendungen in Oracle Cloud – und das kostenlos. Melden Sie sich einmal an und erhalten Sie Zugang zu zwei kostenlosen Angeboten.
Erkunden Sie Cloud-Schulungs-Ressourcen mit Oracle Cloud Infrastructure-Trainingsvideos, Lernlabors zum Selbststudium und Zertifizierungen.
Oracle Cloud Infrastructure kombiniert die Elastizität und Nützlichkeit von Public Cloud mit der Kontrolle, Sicherheit, Performance und Vorhersagbarkeit von On-Premises-Rechenumgebungen.