Instancias de GPU

Oracle Cloud Infrastructure (OCI) Compute ofrece escalabilidad y desempeño líderes en el sector para instancias de hardware dedicado y de máquinas virtuales (VM) con tecnología de GPU NVIDIA y AMD para gráficos convencionales, inferencia de IA, entrenamiento de inteligencia artificial, gemelos digitales y HPC.

Doce laboratorios entrenan modelos de video de IA utilizando la infraestructura de Oracle AI (1:51)

Descubre cómo la infraestructura de Oracle AI y las GPU AMD Instinct proporcionan una base de IA/ML de alto desempeño, escalable y rentable.

¿Por qué utilizar Oracle Cloud Infrastructure para instancias de GPU?

Escalabilidad

131 072

Número máximo de GPU en un OCI Supercluster1

Rendimiento

3.200

Hasta 3.200 Gb/s de ancho de banda de red de clúster RDMA2

Valor

220%

Las GPU para otros CSP pueden ser hasta un 220 % más costosas3

Opciones

VM/BM

Ajustes de tamaño con máquina virtual y rendimiento con instancias con hardware dedicado

1. El superclúster OCI se amplía hasta 131 072 GPU NVIDIA Blackwell B200; más de 100 000 GPU NVIDIA Blackwell B200 en superchips NVIDIA Grace Blackwell GB200; 65 536 GPU NVIDIA H200 Tensor Core; 32 768 GPU NVIDIA A100 Tensor Core; 16 384 GPU NVIDIA H100 Tensor Core; y 16 384 GPU AMD MI300X.

2. Para instancias con hardware dedicado con GPU NVIDIA B200, H200 y H100 y aceleradores AMD Instinct MI300X.

3. Basado en precios bajo demanda a 5 de junio de 2024.

Regístrate en el nuevo programa de prueba antes de comprar para OCI Compute con GPUs AMD Instinct MI300X.

Funciones clave de instancias de GPU

Oracle Cloud Infrastructure es el único proveedor principal en la nube que ofrece instancias con hardware dedicado con GPU NVIDIA y AMD para obtener un alto desempeño sin excesivos costos de virtualización. Para establecer puntos de control durante el entrenamiento de IA, nuestras instancias proporcionan la mayor cantidad de almacenamiento local por nodo (61,4 TB con GPU H100).

GPU NVIDIA y AMD de alto rendimiento

GPU NVIDIA Tensor Core

OCI ofrece el mayor valor y desempeño para instancias informáticas de máquina virtual y con hardware dedicado con tecnología de GPU NVIDIA Blackwell, H200 GPU Tensor Core, H100 GPU Tensor Core, GPU L40S, A100 GPU Tensor Core, A10 GPU Tensor Core y GPU NVIDIA de generación anterior.

Superchips de NVIDIA

OCI ofrece el superchip NVIDIA GB200 Grace Blackwell en superclústeres que se escalan a más de 100 000 GPU.

Aceleradores AMD Instinct

OCI ofrece GPU AMD Instinct MI300X con 192 GB de memoria a un precio competitivo de 6 $ por GPU-hora.

Redes de cluster de alto rendimiento.

La red de clústeres de latencia ultrabaja de Oracle, basada en el acceso remoto directo a la memoria (RDMA), proporciona una latencia de microsegundos.

Instancias de GPU NVIDIA de alto rendimiento
Entrenamiento de GPT-3 175B: tiempo de entrenamiento frente al número de GPU NVIDIA H100 implementadas en OCI Supercluster (0:55). Fuente: Desempeño de OCI para el entrenamiento MLPerf v4.1

Implementa en máquinas virtuales, instancias con hardware dedicado y clústeres de Kubernetes

Instancias de máquina virtual

En el caso de máquinas virtuales, elige entre arquitecturas de GPU Hopper, Ampere y versiones anteriores de NVIDIA de entre uno y cuatro núcleos, 16 a 64 GB de memoria de GPU por máquina virtual y hasta 480 GB de ancho de banda de red.

Instancias de bare metal

Utiliza OCI Supercluster con instancias con hardware dedicado que incluyen GPU AMD Instinct, GPU o Superchips NVIDIA Blackwell, GPU o Superchips NVIDIA Hopper y GPU NVIDIA Ampere.

Organización de Kubernetes

Aprovecha las ventajas de Kubernetes gestionado, malla de servicios y registro de contenedores para organizar el entrenamiento y la inferencia de IA y aprendizaje automático (ML) con contenedores.

Accede a software de fácil acceso

Acceda a imágenes de software y disco

Oracle Cloud Marketplace proporciona imágenes de software y disco para modelos de ciencia de datos, análisis, inteligencia artificial (IA), y aprendizaje automático (ML) para que los clientes obtengan rápidamente insights a partir de sus datos.

NVIDIA AI Enterprise

Accede a NVIDIA AI Enterprise, una plataforma de software integral para la ciencia de datos y la IA de producción, que incluye IA generativa, visión informática e IA de voz.

NVIDIA DGX Cloud

NVIDIA DGX Cloud en OCI es una plataforma de entrenamiento de IA como servicio que ofrece a los desarrolladores una experiencia sin servidor optimizada para la IA generativa.

NVIDIA GPU Cloud Machine Image

Utiliza NVIDIA GPU Cloud Machine Image para cientos de aplicaciones optimizadas para GPU destinadas al aprendizaje automático, aprendizaje profundo y computación de alto rendimiento que abarcan una amplia gama de sectores y cargas de trabajo.

NVIDIA RTX Virtual Workstation

Ofrece un alto desempeño de las estaciones de trabajo cuando los colaboradores lo necesiten ejecutando NVIDIA RTX Virtual Workstation en Oracle Cloud.

Controla tu entorno informático de IA y tus datos

Nube distribuida

Cuando se combina con los recursos informáticos de GPU, la nube distribuida de OCI ayuda a las organizaciones a ejecutar servicios de IA y nube donde y cómo se necesiten.

Nube soberana

Admite la residencia de datos en una región o país, incluidos UE, EE.UU, Reino Unido y Australia.

OCI Dedicated Region

Despliega una región de nube completa en tu centro de datos con OCI Dedicated Region para mantener el control total de tus datos y aplicaciones.

Oracle Alloy

Conviértete en socio de Oracle Alloy y ofrece tus servicios en la nube para satisfacer las necesidades específicas del mercado.

Microservicios y contenedores

Container Registry

Los desarrolladores que crean aplicaciones con contenedores utilizan un servicio de registro de contenedores privado y de alta disponibilidad gestionado por Oracle para almacenar y compartir imágenes de contenedores. Inserta o extrae imágenes Docker hacia y desde el registro mediante la API Docker V2 y la interfaz de línea de comandos (CLI) estándar de Docker. Las imágenes se pueden extraer directamente en una implementación de Kubernetes.

Oracle Functions

Functions as a Service (FaaS) permite que los desarrolladores ejecuten aplicaciones sin servidor integrables en Oracle Cloud Infrastructure, Oracle Cloud Applications y servicios de terceros. Impulsa la eficiencia de los desarrolladores junto con la comunidad de Fn Project de código abierto.

Instancias de GPU: casos de uso

Infraestructura de IA para la formación y la inferencia de aprendizaje profundo

Entrena modelos de IA mediante OCI Data Science, instancias de hardware dedicado, redes de clusters basadas en RDMA y GPU de NVIDIA.


Entrenamiento e inferencia de IA En este diagrama se describen dos etapas del desarrollo de modelos de aprendizaje profundo: el entrenamiento y la inferencia de modelos. En el entrenamiento de modelo de la izquierda, la red neuronal no entrenada se introduce en un algoritmo de entrenamiento con tecnología de OCI Data Science, recursos informáticos de hardware dedicado, almacenamiento local y redes de clústeres. La salida del algoritmo de entrenamiento es un modelo entrenado con una nueva funcionalidad. El paso de inferencia del modelo se describe a la derecha. Tomemos un modelo entrenado como DALL-E 2, que puede tomar entradas de texto y generar imágenes. Se introduce una entrada de texto en el modelo entrenado y se proporciona una salida de imagen del modelo.

Infraestructura de escritorio virtual (VDI)

Los recursos informáticos de OCI con GPU NVIDIA proporcionan un alto rendimiento constante para VDI.


Infraestructura de escritorio virtual Infrastructura de escritorio virtual

CFD y recursos informáticos de alto rendimiento con instancias de GPU

OCI permite la ingeniería asistida por computadora y la dinámica de fluidos computacional para predicciones rápidas de las propiedades aerodinámicas de los objetos.


CFD y recursos informáticos de alto rendimiento con instancias de GPU CFD y recursos informáticos de alto rendimiento mediante instancias de GPU

Introducción a las instancias de GPU

Pruebe Oracle AI y obtén una versión de prueba de 30 días

Oracle ofrece un nivel de precios gratuito para la mayoría de los servicios de IA, así como una cuenta de prueba gratuita con 300 dólares estadounidenses en créditos para probar servicios adicionales en la nube. Los servicios de IA son una recopilación de ofertas, como la IA generativa, con modelos de aprendizaje automático predefinidos que facilitan a los desarrolladores aplicar la IA a las aplicaciones y operaciones empresariales.

  • ¿Qué servicios de IA y ML de Oracle ofrecen un nivel de precios gratuito?

    • OCI Speech
    • OCI Language
    • OCI Vision
    • OCI Document Understanding
    • Aprendizaje automático de Oracle Database
    • Oracle Data Labeling

    También tienes que pagar solo los costos de computación y almacenamiento para OCI Data Science.

Aprovecha las GPU hoy mismo

Descubre cómo Oracle ayuda a los clientes a aprovechar las GPU NVIDIA y AMD para una variedad de casos de uso de IA.

  • ¿Qué puedes hacer con las instancias de GPU?

    • Alojar LLM con GPU NVIDIA y AMD
    • Realizar entrenamiento de varios nodos distribuido con GPU NVIDIA
    • Automatizar tareas con LLM y generación aumentada de recuperación
    • Escala de inferencia de NVIDIA NIM

Descubre todo lo que puedes ahorrar con OCI

Los precios de Oracle Cloud son sencillos, con tarifas consistentemente bajas en todo el mundo, y con apoyo a una amplia gama de casos de uso. Para hacer una estimación de tu tarifa reducida, da un vistazo a la calculadora de costos y configura los servicios que se adapten mejor a tus necesidades.

Descubre la diferencia

  • 1/4 de los costos de ancho de banda saliente
  • 3 veces la relación precio-rendimiento de los recursos informáticos
  • El mismo bajo precio en cada región
  • Precios bajos sin compromisos de largo plazo

Accede a expertos en GPU e IA

Obtén ayuda para crear tu próxima solución de GPU o implementar tu carga de trabajo de IA en la infraestructura de IA de OCI.

  • Pueden responder a preguntas como

    • ¿Cómo puedo empezar a usar Oracle Cloud?
    • ¿Qué tipo de cargas de trabajo de IA puedo ejecutar en OCI?
    • ¿Qué tipos de servicios de IA ofrece OCI?