Oracle Cloud Infrastructure (OCI) GPU Scanner est une solution dédiée qui fournit l'observabilité, les vérifications de l'état et la surveillance des performances pour les workloads de processeur graphique.
Ne manquez pas notre démonstration exclusive en direct le 30 octobre, où nous présenterons le déploiement de Llama sur OCI. Découvrez les dernières technologies d'IA générative en action, explorez des cas d'usage réels et apprenez à créer étape par étape des workflows plus intelligents et plus automatisés.
Les principaux architectes d'OCI révèlent comment les réseaux de cluster optimisent l'évolutivité pour l'IA générative, de quelques GPU à un supercluster OCI zettascale avec 131 072 GPU NVIDIA Blackwell.
L'infrastructure Oracle AI est évolutive, performante et déployable partout. Découvrez notre évolutivité de pointe, nos instances GPU bare metal et les nombreux autres points qui nous distinguent.
Découvrez le point de vue de l'analyste sur l'infrastructure d'IA OCI avec les GPU AMD et comment cette combinaison peut améliorer la productivité, accélérer le délai de rentabilité et réduire les coûts énergétiques.
OCI GPU Scanner est une solution gérée centralisée pour la surveillance des performances des processeurs graphiques, qui aide à éliminer la recherche manuelle et les scripts, simplifiant ainsi le processus d'analyse comparative.
OCI GPU Scanner réduit les temps d'arrêt et les faux positifs grâce à des vérifications complètes de l'état, des comparaisons de référence et des diagnostics automatisés.
OCI GPU Scanner offre une visibilité personnalisable à l'échelle du locataire et des informations propres à l'équipe, qui peuvent aider à optimiser le partage des ressources et la gestion des coûts pour les clusters de processeur graphique à l'échelle de l'entreprise.
Solution gérée et centralisée qui élimine les recherches manuelles de compatibilité et d'exécution de scripts dans toutes les régions d'une location. Active la visibilité du sharding pour les équipes partageant des clusters volumineux.
Vérifications détaillées de l'état pour le jour zéro (base de référence), le premier jour (contrôle actif) et à partir du deuxième jour (diagnostics en cours), y compris les diagnostics de nœud, multinœud et avancés, avec des comparaisons historiques pour identifier les problèmes.
Prend en charge les processeurs graphiques NVIDIA et AMD, avec le projet d'étendre la prise en charge aux futurs fabricants de puces et aux architectures de nouvelle génération.
Surveille les ressources de processeur graphique dans toutes les régions sans installation par région, en prenant en charge les clusters Oracle Cloud Infrastructure Kubernetes Engine, des clusters de calcul hautes performances, le bare metal et les machines virtuelles.
Compatible avec les outils open source populaires, y compris Grafana et Prometheus, pour des tableaux de bord personnalisables et un stockage/export de données fluides pour les cas d'utilisation des clients.
Fournit des actions correctives recommandées (par exemple, la réinitialisation pour les erreurs hors bus de processeur graphique) et automatise les vérifications de l'état via l'API ou le portail, réduisant ainsi les temps d'arrêt des clients et les faux positifs.
Obtenez de l'aide pour créer votre prochaine solution d'IA ou déployer votre workload sur OCI GPU Scanner.
Entrez dans une nouvelle ère de productivité avec des solutions d'IA générative pour votre entreprise. Découvrez comment Oracle aide les clients à tirer parti de l'IA intégrée dans l'ensemble de la pile technologique.
En savoir plus sur la mise en réseau de clusters RDMA, les instances GPU, les serveurs bare metal, etc.
La tarification d'Oracle Cloud est simple, avec des tarifs faibles homogènes dans le monde entier et prenant en charge un large éventail de cas spécifiques. Pour estimer votre tarif réduit, consultez l’estimateur de coûts et configurez les services en fonction de vos besoins.
Journée de démonstration en direct : les experts Oracle, Meta et NVIDIA déploient Llama sur OCI
Premiers principes : Zettascale OCI Superclusters
Accélération des workloads d'IA avec OCI ()
Enterprise Strategy Group au sujet d'AMD Instinct MI300X