Oracle Cloud Infrastructure (OCI) GPU Scanner es una solución dedicada que proporciona observabilidad, comprobaciones del sistema y supervisión del rendimiento para cargas de trabajo de GPU.
No te pierdas nuestra exclusiva demostración en vivo el 30 de octubre, donde mostraremos el despliegue de Llama en Oracle Cloud Infrastructure. Descubre las últimas tecnologías de IA generativa en acción y casos de uso reales, y aprende a crear flujos de trabajo más inteligentes y automatizados paso a paso.
Los principales arquitectos de OCI revelan cómo las redes de clústeres impulsan GenAI escalable, desde unas pocas GPU hasta un OCI Supercluster zettascale con 131 072 GPU NVIDIA Blackwell.
La infraestructura de Oracle AI es escalable, eficiente e implementable en cualquier lugar. Descubre por qué destacamos con escalabilidad líder del sector, instancias de GPU con hardware dedicado y mucho más.
Descubre la perspectiva de los analistas sobre la infraestructura de IA de OCI con GPU AMD y cómo esta combinación puede mejorar la productividad, acelerar el tiempo de generación de valor y reducir los costos de energía.
OCI GPU Scanner es una solución centralizada y administrada para monitorear el rendimiento de GPU que elimina la investigación manual y el uso de scripts, simplificando todo el proceso de evaluación de benchmarking.
OCI GPU Scanner minimiza el tiempo fuera de servicio y los falsos positivos mediante verificaciones de estado completas, comparaciones con la base y diagnósticos automatizados.
OCI GPU Scanner ofrece visibilidad personalizable a nivel de todo el inquilino e insights específicos para cada equipo, lo que ayuda a optimizar el uso compartido de recursos y la gestión de costos en clústeres de GPU a escala empresarial.
Una solución gestionada y centralizada que elimina la ejecución manual de scripts y la investigación de compatibilidad en todas las regiones de una tenencia. Permite la visibilidad de fragmentación para equipos que comparten clusters grandes.
Controles de salud detallados para el día cero (base), día uno (monitoreo activo) y día dos en adelante (diagnósticos continuos), que incluyen diagnósticos a nivel de nodo, multinodo y avanzados, con comparaciones históricas para identificar problemas con precisión.
Compatible con GPU NVIDIA y AMD, con planes para extender el soporte a futuros fabricantes de chips y arquitecturas de última generación.
Supervisa los recursos de GPU en todas las regiones sin necesidad de instalaciones por región, con soporte para clústeres de Oracle Cloud Infrastructure Kubernetes Engine, clústeres de computación de alto rendimiento, servidores bare metal y máquinas virtuales.
Compatible con herramientas de código abierto muy usadas, como Grafana y Prometheus, lo que posibilita crear paneles personalizables y almacenar o exportar datos sin complicaciones para el cliente.
Ofrece acciones de remediación recomendadas (por ejemplo, reiniciar en caso de errores de GPU fuera del bus) y automatiza las verificaciones de salud mediante API o a través del portal, reduciendo el tiempo de inactividad para el cliente y los falsos positivos.
Obtén ayuda para crear tu próxima solución de IA o implementar tu carga de trabajo en OCI GPU Scanner.
Entra en una nueva era de productividad con soluciones de IA generativa creadas para tu empresa. Descubre cómo Oracle ayuda a los clientes a aprovechar la IA integrada en toda la pila tecnológica.
Obtén más información sobre redes de clúster RDMA, instancias de GPU, servidores con hardware dedicado y mucho más.
Los precios de Oracle Cloud son sencillos, con tarifas consistentemente bajas en todo el mundo, y con apoyo a una amplia gama de casos de uso. Para hacer una estimación de tu tarifa reducida, da un vistazo a la calculadora de costos y configura los servicios que se adapten mejor a tus necesidades.
Live Demo Day: Expertos de Oracle, Meta y NVIDIA despliegan Llama en Oracle Cloud Infrastructure
Primeros principios: Superclusters de OCI de Zettascale
Aceleración de cargas de trabajo de IA con OCI (PDF)
Grupo de estrategias empresariales en instancias de AMD MI300X