Execute as cargas de trabalho de IA mais exigentes com mais rapidez, incluindo IA generativa, visão computacional e análise preditiva, em qualquer lugar da nossa nuvem distribuída. Use o Oracle Cloud Infrastructure (OCI) Supercluster para dimensionar até 65.536 GPUs hoje e 131.072 GPUs em breve.*
Aumente o treinamento de IA com instâncias bare metal de GPU exclusivas da OCI e rede de cluster RDMA ultrarrápida que reduzem a latência para apenas 2,5 microssegundos. Obtenha economia de até 220% em VMs de GPU do que com outros provedores de nuvem.
Aproveite os pontos de acesso NFS (HPMTs) de alto desempenho para até 500 Gb/s de taxa de transferência sustentada. Use 61,44 TB de capacidade de armazenamento local, a mais alta do setor para instâncias com GPUs NVIDIA H100.
A nuvem distribuída da Oracle permite que você implemente infraestrutura de IA em qualquer lugar para ajudar a atender aos requisitos de desempenho, segurança e soberania de IA.
Até 131.072 GPUs, 8X mais escalabilidade
As inovações de malha de rede permitirão que o OCI Supercluster seja dimensionado para até 131.072 GPUs NVIDIA B200 e mais de 100.000 Blackwell GPUs no NVIDIA Grace Blackwell Superchips. O OCI Supercluster é dimensionado para até 65.536 GPUs NVIDIA H200 hoje.
Não importa se você está procurando realizar inferência, ajustar ou treinar modelos de grande escala para IA generativa; a OCI oferece opções de cluster de GPU bare metal e máquina virtual líderes no setor, alimentadas por uma rede de largura de banda ultra-alta e armazenamento de alto desempenho para atender às suas necessidades de IA.
Computação sobrecarregada
• Instâncias bare metal sem sobrecarga de hipervisor
• Aceleradas pelas GPUs NVIDIA H200, H100, L40S e A100
• Opção de usar GPUs AMD MI300X
• Unidade de processamento de dados (DPU) para aceleração de hardware integrada
Capacidade massiva e armazenamento de alto rendimento
• Armazenamento local: até 61,44 TB de capacidade de SSD NVMe
• Armazenamento de arquivos: destino de montagem de alto desempenho (HPMT) com até 80 Gb/s de rendimento (agora com disponibilidade geral) e serviço Lustre totalmente gerenciado (em breve)
• Armazenamento em bloco: volumes balanceados, de alto desempenho e de desempenho ultra-alto com um SLA de desempenho
• Armazenamento de objetos: níveis de classe de armazenamento distintos, replicação de bucket e limites de alta capacidade
Rede ultrarrápida
• RDMA projetado sob medida sobre protocolo Ethernet Convergente (RoCE v2)
• 2,5 a 9,1 microssegundos de latência para rede de cluster
• Até 3.200 Gb/s de largura de banda de rede de cluster
• Até 200 Gb/s de largura de banda de rede front-end
As instâncias bare metal da OCI com GPUs AMD MI300X, NVIDIA L40S, NVIDIA H100 e NVIDIA A100 permitem executar grandes modelos de IA para casos de uso que incluem deep learning, IA conversacional e IA generativa. Com o OCI Supercluster, você pode dimensionar até 32.768 GPUs A100, 16.384 GPUs H100, 16.384 GPUs MI300X e 3.840 GPUs L40S por cluster.
A rede de cluster RDMA de alta velocidade alimentada por placas de interface de rede NVIDIA ConnectX com RDMA sobre Ethernet convergente versão 2 permite que você crie grandes clusters de instâncias de GPU com a mesma rede de latência ultrabaixa e escalabilidade de aplicações que você espera on-premises.
Você não paga mais pelo recurso RDMA, armazenamento em blocos ou largura de banda da rede, e os primeiros 10 TB de saída são gratuitos.
Pelo OCI Supercluster, os clientes podem acessar armazenamento local, em blocos, de objetos e de arquivos para computação em exaescala. Entre os principais provedores de nuvem, a OCI oferece a mais alta capacidade de armazenamento NVMe local de alto desempenho para checkpoint mais frequente durante as execuções de treinamento, resultando em recuperação mais rápida de falhas.
Os sistemas de arquivos HPC, como BeeGFS, GlusterFS, Lustre e WEKA, podem ser usados para treinamento de IA em escala sem comprometer o desempenho.
Assista ao arquiteto técnico Pradeep Vincent explicar como o OCI Supercluster potencializa o treinamento e a inferência de modelos de machine learning, podendo ser dimensionados para dezenas de milhares de GPUs NVIDIA.
Treine modelos de IA em instâncias bare metal da OCI com GPUs, rede de cluster RDMA e o OCI Data Science.
Proteger os bilhões de transações financeiras que acontecem todos os dias requer ferramentas aprimoradas de IA que possam analisar grandes quantidades de dados históricos dos clientes. Os modelos de IA executados no OCI Compute com GPUs NVIDIA, juntamente com ferramentas de gerenciamento de modelos, como o OCI Data Science e outros modelos de código aberto, ajudam as instituições financeiras a mitigar fraudes.
A IA é frequentemente usada para analisar vários tipos de imagens médicas (como raios-X e ressonâncias magnéticas) em um hospital. Modelos treinados podem ajudar a priorizar casos que precisam de revisão imediata por um radiologista e relatar resultados conclusivos sobre outros.
A descoberta de medicamentos é um processo demorado e caro que pode levar muitos anos e custar milhões de dólares. Utilizando a infraestrutura e a análise de IA, os pesquisadores podem acelerar a descoberta de medicamentos. Além disso, o OCI Compute com GPUs NVIDIA, juntamente com ferramentas de gerenciamento de fluxo de trabalho de IA, como BioNeMo, permite que os clientes selecionem e pré-processem seus dados.
A Oracle oferece um modo gratuito para a maioria dos serviços de IA, bem como uma conta de teste gratuita com US$ 300 em créditos para experimentar outros serviços de nuvem. Os serviços de IA são uma coleção de ofertas, incluindo IA generativa, com modelos de machine-learning pré-criados que facilitam para os desenvolvedores aplicar IA a aplicações e operações de negócios.
Você só precisa pagar as taxas de computação e armazenamento do OCI Data Science.
Saiba mais sobre rede de cluster RDMA, instâncias de GPU, servidores bare metal e muito mais.
Os preços da Oracle Cloud são simples, com preço baixo consistente em todo o mundo, oferecendo suporte a uma ampla gama de casos de uso. Para estimar a sua taxa, consulte a estimativa de custos e configure os serviços para atender às suas necessidades.
Receba ajuda para criar sua próxima solução de IA ou implementar sua carga de trabalho na infraestrutura de IA da OCI.