Oracle Cloud Infrastructure (OCI) Supercluster provides ultrafast cluster networking, HPC storage, and OCI Compute bare metal instances. OCI Supercluster is ideal for training generative AI, including conversational applications and diffusion models. With support for up to tens of thousands of NVIDIA GPUs, OCI Compute bare metal instances and VMs can power applications for computer vision, natural language processing, recommendation systems, and more.
Oracle and NVIDIA partner to speed AI adoption for enterprises (2:06)
Déployez jusqu'à des dizaines de milliers de processeurs graphiques par cluster pour une évolutivité considérablement accrue.
Réduisez le temps nécessaire pour entraîner votre IA avec une architecture réseau Ethernet simple qui fournit des performances ultra élevées à grande échelle.
Obtenez l'aide d'ingénieurspour l'architecture de solution, le réseau, la sécurité, l'audit, l'intégration, la migration d'applications et bien plus encore.
Chaque instance bare metal d'OCI Compute est connectée à l'aide du réseau de cluster à très faible latence d'OCI, qui peut évoluer jusqu'à des dizaines de milliers de processeurs graphiques NVIDIA H100 ou A100 dans un seul cluster. Ces instances utilisent l'architecture réseau à hautes performances unique d'OCI, qui tire parti du RDMA sur l'Ethernet convergé (RoCE) v2 pour une latence en microsecondes entre les nœuds et une bande passante proche du débit de ligne.
L'implémentation d'OCI de RoCE v2 fournit
Le calcul haute performance sur OCI offre des fonctionnalités informatiques puissantes et économiques qui permettent de résoudre des problèmes mathématiques et scientifiques complexes dans tous les secteurs.
Le graphique présente les performances de la structure réseau de cluster d'Oracle. En dessous de 10 000 cellules de simulation par cœur, OCI peut évoluer au-delà de 100 % avec des codes CFD répandus, soit les mêmes performances qu'on-premises. Il est important de noter que sans la contrainte de la virtualisation, les machines HPC bare metal peuvent utiliser tous les cœurs du nœud sans avoir à réserver aucun cœur pour des frais généraux coûteux.
Le calcul haute performance sur OCI rivalise sur les performances des solutions sur site avec l'élasticité et les coûts basés sur la consommation du cloud, offrant un potentiel à la demande d'évolution simultanée vers des dizaines de milliers de cœurs. Les clients ont accès à des processeurs à haute fréquence, à un stockage local rapide et dense, à des réseaux de cluster RDMA à haut débit et à très faible latence et aux outils permettant d'automatiser et d'exécuter des tâches avec aisance.
OCI peut fournir des latences allant jusqu'à 1,7 microseconde, une performance inégalée par les autres fournisseurs de cloud, selon une analyse de Exabyte.io. En activant les clusters connectés à RDMA, OCI étend le réseau de cluster pour les serveurs bare metal équipés de NVIDIA H100 et de GPU A100. La structure réseau back-end révolutionnaire permet aux clients de créer des clusters avec la même évolutivité d'application et de réseau à faible latence qu'on-premises.
Les instances de processeurs graphiques NVIDIA bare metal d'OCI offrent aux start-up une plateforme de calcul haute performance pour les applications qui tirent parti du deep learning, des systèmes de recommandations et des tâches de calcul haute performance massivement parallèles. Les instances GPU sont idéales pour l'entraînement de modèles, le calcul d’inférence, la physique et le rendu d’image et les applications massivement parallèles.
OCI propose des instances avec huit GPU NVIDIA H100 ou NVIDIA A100. Alors qu'OCI Supercluster offre la possibilité d'évoluer jusqu'à des centaines ou des milliers de GPU par cluster, OCI offre également la possibilité de se déployer à une échelle beaucoup plus petite, en commençant par un seul GPU.
Des clients tels qu'Adept, un laboratoire de recherche et de produits de ML développant un coéquipier d'IA universel, utilisent la puissance des technologies d'OCI et de NVIDIA pour créer la prochaine génération de modèles d'IA. En exécutant des milliers de GPU NVIDIA sur des clusters d'instances de calcul bare metal OCI et en capitalisant sur la bande passante réseau d'OCI, Adept peut entraîner des modèles d'IA et de machine learning à grande échelle plus rapidement et plus économiquement qu'auparavant.
« Grâce à l'évolutivité et à la puissance de calcul des technologies d'OCI et de NVIDIA, nous pouvons entraîner un réseau neuronal qui permet d'utiliser toutes les applications, tous les sites Web et toutes les API imaginables, en s'appuyant sur les fonctionnalités déjà créées par les éditeurs de logiciels. »
David Luan, PDG
Adept
« Cette relation avec OCI est, à nos yeux, une relation à long terme. Nous sommes ravis de tirer parti des GPU et de les utiliser pour entraîner notre nouvelle génération d'IA vocale. Nous pensons qu'OCI sera un soutien essentiel dans la poursuite de notre croissance. »
James Hom, Cofondateur et Vice-Président des produits
SoundHound
« Avec Oracle Cloud, nous exécutons entre quatre et huit GPU en parallèle pour accélérer grandement la progression de nos recherches, ce qui signifie que nous pouvons réaliser une expérience en quelques heures. »
Hyeokhyen Kwon, Professeur adjoint en informatique biomédicale
à l'Université Emory
« Lors de l'exécution d'expériences avec la même configuration, A100 utilise environ 25 % de temps en moins en moyenne. Et le processus fluide de configuration de la machine sur Oracle Cloud le rend encore meilleur. »
Shuyang Cao, assistant en recherche
à l'Université du Michigan
Découvrez pourquoi MosaicML a constaté qu'OCI était la meilleure base pour entraîner son IA.
« Softdrive est l'avenir des ordinateurs professionnels. Sur le marché des PC cloud, la performance est reine. Les processeurs graphiques NVIDIA sur les serveurs bare metal OCI ont considérablement amélioré l'expérience de nos clients. »
Leonard Ivey, Cofondateur de
Softdrive
OCI fournit des experts techniques de premier ordre pour vous aider à être opérationnel. Nous supprimons les obstacles techniques d'un déploiement complexe, de la planification au lancement, pour vous aider à réussir.
OCI est conçu pour les entreprises qui recherchent des performances supérieures, des coûts toujours plus bas et une migration vers le cloud plus facile pour leurs applications actuelles sur site.
Seshadri Dehalisan, Akshai Parthasarathy et Ruzhu Chen d'Oracle
Oracle Cloud Infrastructure (OCI) obtient d'excellents résultats suite à plusieurs tests de performance de la suite MLCommons Inference Datacenter v3.1, la norme du secteur pour mesurer les performances d'infrastructure d'IA. OCI a été testé sur plusieurs formes alimentées par des processeurs graphiques NVIDIA, notamment le processeur graphique Tensor Core NVIDIA H100, le processeur graphique Tensor Core NVIDIA A100 et le processeur graphique Tensor Core NVIDIA A10, avec les résultats clés suivants :