Infraestructura de IA

Ejecute más rápidamente las cargas de trabajo de IA más exigentes, incluidas la IA generativa, la visión informática y el análisis predictivo, en cualquier lugar de nuestra nube distribuida. Utiliza Oracle Cloud Infrastructure (OCI) Supercluster para ampliar hasta 32 768 GPU en la actualidad y 65 536 GPU en el futuro.*

OCI Supercluster: la infraestructura que impulsa la IA generativa a escala (0:55)

¿Por qué ejecutar en la infraestructura de IA de OCI?

Desempeño y valor de IA líderes

La infraestructura de IA de OCI ofrece desempeño y valor de nivel más alto para todas las cargas de trabajo de IA, incluidas las inferencias, el entrenamiento y los asistentes de IA.

Ampliar hasta 65 536 GPU*

Solo OCI Supercluster ofrece una escala líder del sector con recursos informáticos con hardware dedicado para que puedas acelerar la formación de modelos de IA de billones de parámetros.

Activar IA soberana

La nube distribuida de Oracle te permite implementar infraestructura de IA en cualquier lugar para cumplir con los requisitos de desempeño, seguridad y soberanía de IA.

*OCI Supercluster escala hasta 65.536 GPU NVIDIA B200 (previsto); 32.768 GPU NVIDIA A100; y 16.384 GPU NVIDIA H100.

Los innovadores de IA aprovechan OCI para alojar, entrenar e inferir modelos de IA de última generación.

Conoce OCI Supercluster para el entrenamiento de IA a gran escala

Descripción general

OCI Supercluster te permite implementar hasta 32.768 GPU líderes del sector por clúster, aprovechando las redes de clústeres RDMA y el almacenamiento local para lograr un entrenamiento rápido e inferir en modelos de IA a gran escala.

Clusters grandes y escalables con GPU NVIDIA H100, A100 y L40S

Recursos informáticos
• GPU 8x NVIDIA H100; SSD NVMe de 61,44 TB por nodo
• GPU 8x NVIDIA A100; SSD NVMe de 27,2 TB por nodo
• GPU 4x NVIDIA L40S; SSD 7,38 TB NVMe por nodo

Almacenamiento
• Almacenamiento de bloques: hasta 32 TB por volumen
• Almacenamiento de objetos: hasta 10 TiB por objeto
• Almacenamiento de archivos: hasta 8 EB por sistema de archivos
• Clusters de almacenamiento con unidades de E/S densa

Redes
• RDMA sobre Ethernet convergente (RoCE v2)
• Pocos microsegundos de latencia entre nodos
• Ancho de banda entre nodos de OCI Supercluster:
o NVIDIA H100: 3200 Gb/s
o NVIDIA A100: 1600 Gb/s
o NVIDIA L40S: 800 Gb/s

Almacenamiento para OCI Supercluster

A través de OCI Supercluster, los clientes pueden acceder al almacenamiento local, de bloques, de objetos y de archivos para la computación a exascala. Entre los principales proveedores de nube, OCI ofrece la mayor capacidad de almacenamiento NVMe local de alto rendimiento para establecer puntos de control más frecuentes durante las ejecuciones de entrenamiento, lo que resulta en una recuperación más rápida de las fallas.

Los sistemas de archivos de HPC, incluidos BeeGFS, GlusterFS, Lustre y WEKA, se pueden utilizar para el entrenamiento de IA a escala sin comprometer el desempeño.

Redes para Supercluster

La red de clústeres RDMA de alta velocidad impulsada por tarjetas de interfaz de red NVIDIA ConnectX con RDMA sobre Ethernet convergente versión 2 le permite crear grandes clústeres de instancias de GPU con la misma red de latencia ultrabaja y escalabilidad de aplicaciones que espera en el entorno local.

No pagas más por la capacidad de RDMA, el almacenamiento de bloques o el ancho de banda de red, y los primeros 10 TB de salida son gratuitos.

Redes para Supercluster
Ampliar+
El diagrama muestra una red RDMA de Supercluster con ocho GPU NVIDIA A100 por nodo conectado mediante un tejido de red de dúplex completo con un ancho de banda entre nodos de 1,6 Tb/s en total.

Recursos informáticos para Supercluster

Las instancias con hardware bare metal de OCI con tecnología de GPU NVIDIA L40S, H100 y A100 permiten a los clientes ejecutar grandes modelos de IA para casos de uso que incluyen aprendizaje profundo, IA conversacional e IA generativa. Con OCI Supercluster, los clientes pueden escalar hasta 32 768 GPU A100, 16 384 GPU H100 y 3 840 GPU L40S por cluster.

El diagrama muestra los nodos de clúster de GPU alimentados por GPU NVIDIA A100 y redes con una latencia inferior a dos microsegundos.

Cómo funciona OCI Supercluster

Mira al arquitecto técnico jefe Pradeep Vincent explicar cómo OCI Supercluster impulsa el entrenamiento y la inferencia de modelos de aprendizaje automático, escalando a decenas de miles de GPU NVIDIA.

Casos de uso típicos de infraestructura de IA

Entrena modelos de IA en instancias específicas de OCI basadas en GPU, redes de clústeres de RDMA y OCI Data Science.


Diagrama de entrenamiento e inferencias de aprendizaje profundo, descripción a continuación
Entrena modelos de IA en instancias específicas de OCI basadas en GPU, redes de clústeres de RDMA y OCI Data Science.

Proteger los miles de millones de transacciones financieras que se producen todos los días requiere herramientas de IA que puedan analizar grandes cantidades de datos históricos de clientes. Los modelos de IA que se ejecutan en OCI Compute con tecnología de GPU NVIDIA junto con herramientas de gestión de modelos como OCI Data Science y otros modelos de código abierto ayudan a las instituciones financieras a mitigar el fraude.


Detección de fraude aumentada por diagrama de IA, descripción a continuación
Los modelos de IA que se ejecutan en OCI Compute con tecnología de GPU NVIDIA junto con herramientas de gestión de modelos como OCI Data Science y otros modelos de código abierto ayudan a las instituciones financieras a mitigar el fraude.

La IA se utiliza a menudo para analizar diversos tipos de imágenes médicas (como rayos X y resonancias magnéticas) en un hospital. Los modelos entrenados ayudan a priorizar los casos que necesitan revisión inmediata por parte de un radiólogo e informan resultados concluyentes sobre otros.


Diagrama de análisis de imágenes médicas basado en IA, descripción a continuación
Los modelos entrenados que se ejecutan en OCI Compute con GPU analizan imágenes médicas y proporcionan resultados concluyentes inmediatos o priorizan imágenes para una revisión más detallada.

El descubrimiento de medicamentos es un proceso lento y costoso que puede tardar muchos años y costar millones de dólares. Al aprovechar la infraestructura y el análisis de IA, los investigadores aceleran dicho proceso. Además, OCI Compute con tecnología de GPU NVIDIA junto con herramientas de gestión de flujos de trabajo de IA como BioNeMo permite a los clientes curar y preprocesar sus datos.


Uso de la IA para acelerar el descubrimiento de fármacos, descripción a continuación
Al aprovechar la infraestructura y el análisis de IA, los investigadores aceleran el descubrimiento de fármacos, seleccionan y preprocesan sus datos.

Éxitos de clientes con infraestructura de IA

Explora más historias de clientes

Comienza a utilizar OCI AI infrastructure

Pruebe Oracle AI y obtén una versión de prueba de 30 días

Oracle ofrece un nivel de precios gratuito para la mayoría de los servicios de IA, así como una cuenta de prueba gratuita con 300 dólares estadounidenses en créditos para probar servicios adicionales en la nube. Los servicios de IA son una recopilación de ofertas, como la IA generativa, con modelos de aprendizaje automático predefinidos que facilitan a los desarrolladores aplicar la IA a las aplicaciones y operaciones empresariales.

  • ¿Qué servicios de IA y ML de Oracle ofrecen un nivel de precios gratuito?

    • OCI Speech
    • OCI Language
    • OCI Vision
    • OCI Document Understanding
    • Aprendizaje automático de Oracle Database
    • Oracle Data Labeling

    También tienes que pagar solo los costos de computación y almacenamiento para OCI Data Science.

Recursos adicionales

Obtén más información sobre redes de clúster RDMA, instancias de GPU, servidores con hardware dedicado y mucho más.

Descubre todo lo que puedes ahorrar con OCI

Los precios de Oracle Cloud son sencillos, con tarifas consistentemente bajas en todo el mundo, y con apoyo a una amplia gama de casos de uso. Para hacer una estimación de tu tarifa reducida, da un vistazo a la calculadora de costos y configura los servicios que se adapten mejor a tus necesidades.

Accede a expertos en materia de IA

Obtén ayuda para crear tu próxima solución de IA o implementar tu carga de trabajo en la infraestructura de IA de OCI.

  • Pueden responder a preguntas como

    • ¿Cómo puedo empezar a usar Oracle Cloud?
    • ¿Qué tipo de cargas de trabajo de IA puedo ejecutar en OCI?
    • ¿Qué tipos de servicios de IA ofrece OCI?