As soluções Oracle Cloud HPC combinam o desempenho de soluções on-premise com a elasticidade e os custos baseados no consumo da nuvem, dando aos clientes a opção de migrar ou complementar os sistemas on-premise com uso intensivo de capital. A plataforma Oracle Cloud Infrastructure HPC inclui instâncias de computação bare metal, redes de cluster de baixa latência para RDMA, soluções de armazenamento de alto desempenho e sistemas de arquivos, isolamento de tráfego de rede e as ferramentas necessárias para automatizar e executar trabalhos perfeitamente na nuvem. Para tudo, desde simulações de colisões na indústria automotiva até análises sísmicas para empresas de petróleo e gás e renderização de efeitos especiais para empresas de mídia, a infraestrutura baseada em nuvem da Oracle está permitindo que os clientes resolvam problemas técnicos complexos - mais rapidamente.
Soluções por setor
A Oracle construiu a infraestrutura e os serviços em nuvem para dar suporte às necessidades dos clientes de classe empresarial que tradicionalmente dependiam de sistemas on-premise para obter resultados oportunos. Com a Oracle, os clientes evitam longos tempos de filas e atrasos potenciais no design e, em vez disso, se concentram em reinventar como desenvolvem produtos, medem riscos, fornecem experiências e revolucionam seus setores.
- Manufatura—Gêmeos digitais, engenharia auxiliada por computador, dinâmica de fluidos de computação
- Finanças—Plataformas de negociação, modelagem de risco
- Meios de comunicação—Renderização de efeitos visuais
- Em todos os setores—IA, machine learning, aprendizado profundo
- Pesquisa—Pesquisa médica, descoberta de drogas, genômica, mudança climática
Dinâmica de fluidos computacional na manufatura
Imagem cortesia da AltairA Dinâmica de Fluidos Computacional (CFD) é uma carga de trabalho comum que simula o movimento do ar e do fluido para simplificar e acelerar a engenharia do produto. Por exemplo, no setor automotivo, ajuda os fabricantes a simular o fluxo de ar da cabine, a dinâmica do óleo do motor e o fluxo de ar ao redor do carro para melhorar a eficiência do combustível. É uma carga de trabalho baseada em MPI fortemente acoplada que se beneficia da rede de cluster Oracle de 100 Gbps, de nossas instâncias de computação baseada em processador Intel de alta frequência e das GPUs NVIDIA mais recentes. O Oracle HPC é 44% mais barato do que o que a AWS oferece.
Fonte: The Open CAE Society of Japan

“Existem três benefícios principais nas soluções Oracle Cloud HPC. Baixo custo, alto desempenho e suporte para as tecnologias mais recentes. A Denso Techno usará a solução Oracle Cloud HPC para estabelecer nossa tecnologia básica.”
—Koji Komura, Gerente Geral do Departamento de Desenvolvimento de VE, DX Propulsion Center, Denso Techno Co., Ltd.

“Estamos entusiasmados em colaborar com a Oracle para oferecer aos nossos clientes o CONVERGE na Oracle Cloud Infrastructure. Com os formatos HPC bare metal da Oracle Cloud Infrastructure e rede de acesso remoto direto à memória (RDMA) de baixa latência, fomos capazes de obter excelente dimensionamento para o CONVERGE.”
—Dra. Kelly Senecal, Proprietária e Vice-Presidente da Convergent Science
O gráfico abaixo mostra o CONVERGE 3.0 na Oracle Cloud Infrastructure fornecendo escalamento quase ideal e quase linear para 4.000 núcleos para uma simulação de Sandia Flame D parcialmente pré-misturada turbulenta em combustão com 170 milhões de células.
Quando a Nissan precisava do melhor lugar para executar suas cargas de trabalho de dinâmica de fluidos computacional (CFD), eles escolheram a Oracle Cloud Infrastructure (OCI). A Nissan depende do design de produto digital para tomar decisões rápidas e críticas de design para melhorar a eficiência de combustível, confiabilidade e segurança de seus carros. Simulações de CFD intensivas em computação e sensíveis à latência são essenciais para ajudá-los a atingir essas eficiências. Ao migrar essas cargas de trabalho para a Oracle Cloud Infrastructure, a Nissan obtém níveis on-premise de desempenho com flexibilidade na nuvem.

“Selecionamos as soluções HPC da Oracle Cloud Infrastructure como parte da nossa estratégia de várias nuvens para atender aos desafios da crescente demanda de simulação sob pressão constante de economia de custos. Acredito que a Oracle trará um ROI significativo para a Nissan.”
—Bing Xu, Gerente Geral, Departamento de Sistemas de Engenharia, Nissan Motor Co, Ltd

“No mundo da dinâmica de fluidos computacional (CFD), há uma pressão constante para acelerar a velocidade de design do produto e, hoje, nossos clientes procuram fazer simulações de alta fidelidade em horas, não semanas. A execução do Simcenter STAR-CCM + na Oracle Cloud Infrastructure permitiu que nossos clientes aumentassem suas simulações de forma rápida e fácil, sem investimentos caros em hardware ou comprometimento da fidelidade da solução. Nossos clientes obtêm o mesmo desempenho e dimensionamento à medida que chegam a um custo menor on-premise, permitindo-lhes tomar melhores decisões de engenharia com mais rapidez.”
—Keith Foston, Gerente de Produto em Nuvem, Siemens
Engenharia de produto duplo digital e teste na manufatura
Os gêmeos digitais são comumente usados para acelerar o projeto de protótipos e testes antes que os produtos físicos sejam produzidos. Uma variedade de pacotes de software de gerenciamento de ciclo de vida de produto (PLM) e simulação de engenharia são usados pelos fabricantes, e todos requerem recursos computacionais significativos baseados em CPU ou GPU.
Altair AcuSolve é capaz de escalar o desempenho com contagens de nós em níveis quase ideais na Oracle Cloud Infrastructure usando nossas redes de cluster para RDMA.
Aprendizado profundo e computação acelerada por GPU
Com a explosão de dados de negócios que vão desde dados de clientes até a Internet das Coisas (IoT), os cientistas de dados precisam de flexibilidade para explorar e construir modelos de aprendizado profundo rapidamente e com mais flexibilidade do que o hardware de TI on-premise tradicional pode fornecer. A Oracle Cloud fornece instâncias de computação de GPU para aprendizado profundo, imagens fáceis de implementar e a flexibilidade para executar uma estação de trabalho de GPU única ou cluster de formatos de várias GPUs.
Os modelos de reconhecimento visual e aprendizado profundo se beneficiam de vários recursos e inovações da Oracle Cloud Infrastructure. Eles incluem instâncias de computação NVIDIA A100 Tensor Core GPU com até 8 GPUs e NVLink apresentando os mais recentes processadores AMD EPYC de 2ª geração rodando a 2,9 GHz, com até 64 núcleos físicos, junto com armazenamento local NVMe para acesso de dados de baixa latência para cargas de trabalho que dependem de pontos de verificação pesados. Essas instâncias de GPU serão as primeiras na Oracle Cloud Infrastructure a oferecer suporte à rede de cluster, nossa interconexão RDMA de 100 Gbps que permite aos clientes executar cargas de trabalho MPI com latências de menos de 2 microssegundos e 1,6 Tbps combinados de largura de banda.
“A Oracle Cloud Infrastructure foi a primeira a lançar uma nova solução NVIDIA Tesla Cloud. Os núcleos do Tensor executam cerca de 125 teraflops, mas usam apenas cerca de 300 watts de potência. Ele nos permite rodar modelos e conjuntos de dados muito antes de qualquer coisa que tínhamos feito antes e ver padrões em dados que não podíamos ver antes que não são óbvios para os humanos. O primeiro modelo que executamos com machine learning era 40% mais preciso do que a versão do modelo que estava em produção na época. Esperávamos que demorasse horas, mas levou apenas alguns minutos.”
—James Kelloway, Gerente de Inteligência de Energia, National Grid ESO
Negociação de alta frequência
Os aplicativos financeiros, incluindo aplicativos comerciais, exigem uma infraestrutura de alto desempenho e baixa latência, que fornece um desempenho de “baixo jitter” muito consistente. Esses aplicativos não eram um objetivo de design das primeiras arquiteturas de nuvem e demoraram a migrar para a nuvem. A Oracle Cloud Infrastructure fornece as características de desempenho, como latência de menos de 2 microssegundos no cluster que esses aplicativos exigem, rivalizando com soluções personalizadas e caras on-premise e entregando os resultados de que os clientes precisam para habilitar esses aplicativos.
“A Oracle Cloud Infrastructure é capaz de suportar latências determinísticas no nível de 10μs em volumes de mensagens muito altos. Há evidências suficientes para justificar a exploração da implementação de aplicativos sensíveis de baixa latência para a OCI. Isso é significativo porque os serviços que exigem esse nível de serviço evitam implementações dispendiosas no local.”
—Larry Ryan, Diretor Técnico, BJSS
Renderização de efeitos visuais
A computação de alto desempenho fornece a potência para os efeitos visuais onipresentes de hoje, desde os efeitos especiais do seu filme de sucesso de bilheteria até anúncios de TV e os mais recentes títulos de jogos para PC e console, todos desenvolvidos por empresas de mídia que precisam de desempenho de HPC e GPU sob demanda. A Estação de Trabalho Virtual NVIDIA Quadro no desempenho da OCI é consistente com estações de trabalho de gráficos de ponta dispendiosas, mas com a Oracle você pode acessar esse desempenho por alguns dólares por hora. Abaixo, compartilhamos alguns dos resultados do benchmark SPECviewperf 13. Experimente você mesmo, provisionando uma GPU na Oracle Cloud e executando o benchmark disponível.
Para dar ao usuário uma ideia de como isso funciona, executamos o benchmark SPECviewperf® 13 em nossa forma de GPU VM.2.1, que fornece uma GPU NVIDIA P100, e a comparamos a uma estação de trabalho alimentada por um P2000. O benchmark SPECviewperf® 13 é o padrão mundial para medir o desempenho gráfico com base em aplicativos profissionais.

“Com a Oracle Cloud Infrastructure, não há necessidade de enfileirar solicitações ou agendar renderizações. Nossos clientes podem acessar um número ilimitado de máquinas sempre que precisarem, sem ter que pagar pela capacidade não utilizada quando não precisam.”
—Mark Ross, Cofundador, GridMarkets

“Em todo o mundo, a virtualização está ajudando as empresas a se manterem produtivas durante esses tempos difíceis. Com Estações de Trabalho Virtuais Quadro na Oracle Cloud, profissionais criativos e técnicos podem acessar facilmente o desempenho de que precisam para trabalhar em qualquer lugar.”
—Anne Hecht, Diretora Sênior de marketing de produtos de virtualização, NVIDIA
Pesquisa
A plataforma de supercomputação da Oracle Cloud Infrastructure dá aos pesquisadores acesso a GPUs NVIDIA bare metal, instâncias de computação de alto desempenho e uma rede em cluster de baixa latência. Os pesquisadores podem criar clusters para executar cálculos em grande escala para acelerar a pesquisa em vários ramos da ciência e da engenharia, como descoberta de drogas, genômica, previsão do tempo, exploração espacial e muito mais. Por meio de programas como Oracle for Research, a Oracle está trabalhando em estreita colaboração com organizações de pesquisa como a University of Bristol e a Royal Holloway University of London para ajudar a acelerar o desenvolvimento de vacinas e soluções avançadas que abordam as mudanças climáticas.

“Podemos simular cenários de sequestro de captura de carbono, resolver problemas ambientais complexos e gerar mudanças significativas no mundo. A Oracle nos ajudou a quebrar a barreira do poder computacional no laboratório.
—Professor Hier-Majumder, Royal Holloway, Universidade de Londres.
A aceleração da pesquisa médica para fornecer candidatos potenciais para doenças pode ser realizada com soluções de HPC que podem explodir, escalar e responder às necessidades do pesquisador. A Universidade de Bristol, no Reino Unido, usa as soluções Oracle HPC para analisar dados de imagem para pesquisas médicas.

“Nossa ambição é criar uma plataforma para reagir rapidamente a doenças, o que envolve a criação de terabytes de dados de imagem. Usando a Oracle Cloud, podemos distribuir os dados por vários processadores e obter resultados em uma fração do tempo de um sistema on-premise tradicional.”
—Imre Berger, Professor de Bioquímica e Química, Universidade de Bristol
Armazenamento de alto desempenho
A taxa de transferência de dados é extremamente importante para que os aplicativos HPC operem com eficiência e permitam o compartilhamento de dados no cluster de computação. O carregamento e o armazenamento de grandes conjuntos de dados durante o processamento exigem um sistema de arquivos que possa responder às solicitações de forma extremamente rápida e confiável, com capacidade de resposta linear e consistente. A Oracle Cloud oferece vários modelos de sistema de arquivos HPC, incluindo GlusterFS, BeeGFS, Luster e sistemas de arquivos de alto desempenho IBM Spectrum Scale com rendimento estável e de alta velocidade.

“Minha equipe testou o SAS Grid em muitas nuvens públicas. Estamos felizes em dizer que a Oracle Cloud Infrastructure fornece o rendimento de E/S para o sistema de arquivos compartilhado do IBM Spectrum Scale que é necessário para a SAS Grid.”
—Margaret Crevar, Gerente Sênior, SAS Performance Lab, SAS

“As tecnologias de computação bare metal e rede de cluster da Oracle permitiram que o BeeGFS na Oracle Cloud superasse a latência e o rendimento do sistema de arquivos HPC on-premise para cargas de trabalho MPAS a um preço muito baixo. Usando a rede de cluster RDMA da Oracle Cloud, o BeeGFS pode ter desempenho de até 140 GB/s com apenas 14 servidores.”
—Simon Ponsford, Diretor Técnico, YellowDog
Serviços HPC na Oracle Cloud
Instâncias de computação HPC bare metal
As altas frequências de núcleo e a rede de cluster fornecem às instâncias de computação bare metal da Oracle melhorias significativas de desempenho em relação a outras nuvens públicas e data centers no local. Instâncias de computação bare metal oferecem aos clientes isolamento, visibilidade e controle excepcionais.
Rede de cluster
Enquanto nossos servidores bare metal padrão incluem Ethernet de 25 Gbps dupla para rede rápida, a malha de rede back-end inovadora da Oracle usa placas de interface de rede de 100 Gbps ConnectX-5 da Mellanox para fornecer RDMA sobre Ethernet convergente (RoCE) v2, criando clusters com a mesma rede de baixa latência e escalabilidade de aplicativo que você espera de seus clusters on-premise.
GPUs em Bare Metal e VMs
A Oracle Cloud possui máquina virtual de alto desempenho e opções baseadas em NVIDIA bare metal para cargas de trabalho com muitos gráficos para renderização, IA e cargas de trabalho de aprendizado profundo.
Oracle Linux
O Oracle Linux para Computação de Alto Desempenho combina um ambiente operacional totalmente compatível, aberto e completo que é 100% compatível com o binário do aplicativo com Red Hat Enterprise Linux. O Oracle Linux oferece ferramentas de virtualização, gerenciamento e computação nativa em nuvem - junto com o sistema operacional (SO) Linux - em uma única oferta que atende aos requisitos de computação de alto desempenho. Os clientes que executam HPC no Oracle Linux na Oracle Cloud estão obtendo ganhos de desempenho impressionantes sem sacrifícios ou custos de suporte. Com simulação de falha e cargas de trabalho CFD, o Oracle Linux fornece melhoria de 4-6% nos tempos de simulação.
Sistema de arquivos HPC
O armazenamento tradicional simplesmente não pode fornecer rendimento suficiente para cargas de trabalho de alto desempenho que processam grandes volumes de dados rapidamente. Para atender a essas necessidades, a Oracle facilita a implementação de sistemas de arquivos de alto desempenho GlusterFS, BeeGFS, Luster e IBM Spectrum Scale que podem fornecer até 453 GBps de rendimento agregado para clusters HPC.
Soluções prontas para implementar
Implementação de cluster fácil e automatizada
Implemente clusters de forma rápida e fácil com uma pilha do Oracle Cloud Marketplace (modelo Terraform) que inclui todos os componentes principais para funcionar rapidamente. A pilha oferece a capacidade de instalar o agendador Slurm, OpenMPI e ferramentas para testar a conectividade MPI.
Fácil implementação do sistema de arquivos
A Oracle facilita a implementação de servidores de arquivos de alto desempenho líderes do setor em escala de petabyte com pilhas do Oracle Cloud Marketplace, que incluem automação baseada nas melhores práticas para reduzir a complexidade e o tempo de implementação. Com apenas alguns cliques, os sistemas de arquivos podem estar prontos e funcionando em menos de 15 minutos. O Oracle Cloud Marketplace inclui uma pilha fácil de implementar que cobre BeeGFS, Luster e GlusterFS, assim como pilhas personalizáveis adicionais para cada sistema de arquivo individual.
VMs para ciência de dados
Oracle Cloud Infrastructure Virtual Machines for Data Science são ambientes pré-configurados que permitem construir modelos e entregar valor de negócios com mais rapidez. Oferecem desempenho, segurança e controle excepcionais. Você pode expandir seus recursos de computação conforme necessário usando o escalamento automático de computação e manter os custos sob controle, interrompendo instâncias de computação quando elas não são necessárias.
Você pode ter uma máquina virtual com uma GPU NVIDIA instalada e funcionando em menos de 15 minutos com IDEs, notebooks e estruturas comuns pré-instaladas. Oracle Cloud Infrastructure VMs for Data Science incluem código e dados de amostra básicos para você testar e explorar.
Oracle Cloud HPC - preço-desempenho
Projetamos nossas instâncias de HPC para as cargas de trabalho com maior intensidade computacional, exigindo o desempenho de thread único mais rápido e a rede de menor latência. Todas as instâncias HPC têm uma rede de interconexão de memória direta exclusiva, alimentada por uma rede RDMA não virtualizada e bare-metal. Oferecemos processadores de alta frequência, armazenamento local rápido e denso e uma rede de cluster RDMA com latência < de 2 microssegundos em clusters de dezenas de milhares de núcleos. A AWS não oferece essa arquitetura e sua solução mais próxima, a C5n, é significativamente mais cara.
Oracle Cloud Infrastructure BM.HPC2.36 | AWS c5n.metal | |
---|---|---|
Preço de tabela | $2.70 | US$ 3.888 (Leste dos EUA) |
Armazenamento | SSDs NVME locais | Sem SSD NVMe local |
Memória | 384 GB | 192 GB |
Rede | RDMA | Sem RDMA |
Desempenho SLA | Sim | Não |
Benchmarks | ||
SPECrate 2017 Inteiro | 238 | 237 |
Ponto flutuante SPECrate 2017 | 206 | 206 |
Stream (MB/s) | 146,984 | 140,833 |
Resumo1 2 3 | Custos mais baixos para melhor desempenho com RDMA e garantia de desempenho | 44% mais caro, sem armazenamento SSD local, metade da RAM, sem RDMA e sem SLA de desempenho |

“Oracle Cloud Infrastructure e Rocky DEM colaboraram para fornecer uma experiência escalável aos clientes com desempenho semelhante a clusters on-premise. Os servidores GPU NVIDIA bare metal, sem sobrecarga de hipervisor, ajudam ainda mais a resolver problemas muito grandes em um período de tempo razoável.”
—Marcus Reis, Vice-Presidente da ESSS