Las soluciones de Oracle Cloud HPC combinan el rendimiento de las soluciones locales con la elasticidad y los costes por consumo en la nube, lo que brinda a los clientes la opción de migrar o complementar los sistemas locales que requieren una gran inversión en capital. La plataforma Oracle Cloud Infrastructure HPC incluye instancias de computación bare metal, redes de clústeres de baja latencia para RDMA, sistemas de archivos y soluciones de almacenamiento de alto rendimiento, aislamiento del tráfico de red y las herramientas que necesita para automatizar y ejecutar trabajos sin problemas en la nube. La infraestructura basada en la nube de Oracle permite a los clientes resolver todos los problemas técnicos complejos más rápidamente, desde simulaciones de accidentes en la industria automovilística a análisis sísmicos para empresas de gas y petróleo, pasando por la renderización de efectos especiales para empresas de medios.
Soluciones por industria
Oracle creó la infraestructura y los servicios en la nube para satisfacer las necesidades de los clientes de categoría empresarial que tradicionalmente confiaban en los sistemas locales para lograr los resultados oportunos. Con Oracle, los clientes evitan largos tiempos de espera y posibles retrasos en el diseño y, en cambio, se centran en reinventar la forma en que desarrollan productos, miden el riesgo, ofrecen experiencias y revolucionan sus industrias.
- Fabricación—Gemelos digitales, ingeniería asistida por computadora y dinámica de fluidos computacional
- Finanzas—Plataformas comerciales, modelado de riesgos
- Medios de comunicación—Renderización de efectos visuales
- Todas las industrias—Inteligencia artificial, aprendizaje automático y aprendizaje profundo
- Investigación—Investigación médica, descubrimiento de fármacos, genómica y cambio climático
Dinámica de fluidos computacional en la fabricación
Imagen cortesía de AltairLa dinámica de fluidos computacional (CFD) es una carga de trabajo común que simula el movimiento del aire y de los fluidos para simplificar y acelerar la ingeniería de productos. Por ejemplo, en la industria automovilística, ayuda a los fabricantes a simular el flujo de aire de la cabina, la dinámica del aceite del motor y el flujo de aire alrededor del automóvil para mejorar la eficiencia del combustible. Es una carga de trabajo basada en MPI estrechamente acoplada que se beneficia de la red de clústeres de 100 Gbps de Oracle, de nuestras instancias de computación basadas en el procesador Intel de alta frecuencia y de las últimas GPU de NVIDIA. Oracle HPC es un 44 % menos costoso que las soluciones de AWS.
Fuente: La Open CAE Society de Japón

“Estamos emocionados de colaborar con Oracle para ofrecer CONVERGE a nuestros clientes en Oracle Cloud Infrastructure. Con las formas de la HPC bare metal de Oracle Cloud Infrastructure y la red de acceso directo a memoria remota (RDMA) de baja latencia, pudimos obtener un escalado excelente para CONVERGE”.
—Dr. Kelly Senecal, propietario y vicepresidente de Convergent Science
El siguiente gráfico muestra CONVERGE 3.0 en Oracle Cloud Infrastructure, que proporciona un escalado casi ideal y casi lineal a 4000 núcleos para una simulación de Sandia Flame D parcialmente premezclada y turbulenta en combustión con 170 millones de celdas.
Cuando Nissan necesitaba el mejor lugar para ejecutar sus cargas de trabajo de dinámica de fluidos computacional (CFD), eligió Oracle Cloud Infrastructure (OCI). Nissan confía en el diseño de productos digitales para tomar decisiones de diseño rápidas y críticas a fin de mejorar la eficiencia de combustible, la fiabilidad y la seguridad de sus automóviles. Las simulaciones de CFD sensibles a la latencia que requieren muchos recursos de computación son fundamentales para ayudarles a lograr estas eficiencias. Al migrar estas cargas de trabajo a Oracle Cloud Infrastructure, Nissan obtiene niveles de rendimiento locales con flexibilidad en la nube.

“Seleccionamos las soluciones de HPC de Oracle Cloud Infrastructure como parte de nuestra estrategia de múltiples nubes para afrontar los desafíos de una mayor demanda de simulaciones bajo la presión constante del ahorro de costes. Creo que Oracle traerá un retorno de la inversión significativo a Nissan”.
—Bing Xu, director general, departamento de Sistemas de Ingeniería, Nissan Motor Co. Ltd.

“En el mundo de la dinámica de fluidos computacional (CFD), existe una presión constante para acelerar la velocidad del diseño de productos y, hoy en día, nuestros clientes quieren realizar simulaciones de alta fidelidad en horas, no en semanas. La ejecución de Simcenter STAR-CCM+ en Oracle Cloud Infrastructure ha permitido a nuestros clientes ampliar sus simulaciones de forma rápida y sencilla sin una costosa inversión en hardware y sin comprometer la fidelidad de la solución. Nuestros clientes obtienen el mismo rendimiento y escalabilidad que en las instalaciones a un coste menor, lo que les permite tomar mejores decisiones de ingeniería más rápidamente”.
—Keith Foston, director de productos en la nube, Siemens
Ingeniería y pruebas de productos gemelos digitales en la fabricación
Los gemelos digitales se utilizan comúnmente para acelerar el diseño y las pruebas de prototipos antes de fabricar los productos físicos. Los fabricantes utilizan diversos paquetes de software de simulación de ingeniería y gestión del ciclo de vida del producto (PLM), todos los cuales requieren importantes recursos de computación basados en CPU o GPU.
Altair AcuSolve puede aumentar el rendimiento con recuentos de nodos a niveles casi ideales en Oracle Cloud Infrastructure mediante nuestras redes de clústeres para RDMA.
Aprendizaje profundo y computación acelerada por GPU
Con el aumento de los datos comerciales, que van desde datos de los clientes hasta los de Internet of Things (IoT), los científicos de datos necesitan flexibilidad para explorar y crear modelos de aprendizaje profundo de forma rápida y con más elasticidad de la que puede proporcionar el hardware de TI local tradicional. Oracle Cloud proporciona instancias de computación de GPU para el aprendizaje profundo, las imágenes fáciles de implementar y la flexibilidad de ejecutar una estación de trabajo con una sola GPU o un clúster de formas de múltiples GPU.
Los modelos de reconocimiento visual y aprendizaje profundo se benefician de varias capacidades e innovaciones de Oracle Cloud Infrastructure. Incluyen instancias de computación de GPU NVIDIA A100 Tensor Core anunciadas con hasta 8 GPU y NVLink y con los últimos procesadores AMD EPYC de nueva generación que funcionan a 2,9 GHz, con hasta 64 núcleos físicos, además de almacenamiento local NVMe para acceso a datos de baja latencia para cargas de trabajo que dependen de puntos de control intensos. Estas instancias de GPU serán las primeras en Oracle Cloud Infrastructure que admiten redes de clústeres, nuestras interconexiones RDMA de 100 Gbps que permiten a los clientes ejecutar cargas de trabajo MPI con latencias de menos de 2 microsegundos y un ancho de banda combinado de 1,6 Tbps.
“Oracle Cloud Infrastructure fue el primero en lanzar una nueva solución NVIDIA Tesla en la nube. Los núcleos Tensor funcionan a alrededor de 125 teraflops, pero usan solo alrededor de 300 vatios de potencia. Nos permiten ejecutar modelos y conjuntos de datos mucho antes que cualquier cosa que hayamos utilizado antes y ver patrones en los datos que no podíamos ver antes y que no son obvios para los seres humanos. El primer modelo que ejecutamos con aprendizaje automático fue un 40 % más preciso que la versión del modelo que estaba en producción en ese momento. Esperábamos que llevara horas, pero solo requirió minutos”.
—James Kelloway, director de Inteligencia Energética, National Grid ESO
Comercio de alta frecuencia
Las aplicaciones financieras, incluidas las aplicaciones comerciales, requieren una infraestructura de alto rendimiento y baja latencia, que proporciona un rendimiento uniforme con “pocas fluctuaciones”. Estas aplicaciones no eran un objetivo de diseño de las primeras arquitecturas en la nube y han tardado en trasladarse a la nube. Oracle Cloud Infrastructure proporciona las características de rendimiento que requieren estas aplicaciones, por ejemplo, una latencia en el clúster de menos de 2 microsegundos, rivaliza con las soluciones locales, que son costosas y deben personalizarse, y ofrece los resultados que los clientes necesitan para habilitar estas aplicaciones.
“Oracle Cloud Infrastructure es capaz de admitir latencias deterministas al nivel de 10 μs con volúmenes de mensajes muy altos. Existe evidencia suficiente para justificar la exploración de la implementación de aplicaciones sensibles de baja latencia en OCI. Esto es importante porque los servicios que requieren este nivel de servicio evitan las costosas implementaciones in situ”.
—Larry Ryan, director técnico, BJSS
Renderización de efectos visuales
La computación de alto rendimiento proporciona la potencia necesaria para los efectos visuales omnipresentes de la actualidad, desde los efectos especiales de su película favorita hasta los anuncios de televisión y los últimos juegos para PC y consolas, todos desarrollados por empresas de medios que necesitan rendimiento de HPC y GPU on-demand. El rendimiento de la estación de trabajo virtual NVIDIA Quadro en OCI es constante con las costosas estaciones de trabajo de gráficos de alta gama, pero con Oracle puede acceder a este rendimiento por unos pocos dólares la hora. A continuación, compartimos algunos de los resultados de las pruebas comparativas de SPECviewperf 13. Pruébelo usted mismo mediante el aprovisionamiento de una GPU en Oracle Cloud y la ejecución de la prueba comparativa disponible.
Para dar al usuario una idea de cómo funciona esto, ejecutamos la prueba comparativa SPECviewperf® 13 en nuestra forma de GPU VM.2.1, que proporciona una GPU NVIDIA P100, y la comparamos con una estación de trabajo con tecnología P2000. La prueba comparativa SPECviewperf® 13 es el estándar mundial para medir el rendimiento de gráficos basado en aplicaciones profesionales.

“Con Oracle Cloud Infrastructure, no es necesario poner en cola las solicitudes ni programar las renderizaciones. Nuestros clientes pueden acceder a un número ilimitado de máquinas siempre que las necesiten, sin tener que pagar por la capacidad no utilizada cuando no la necesitan”.
—Mark Ross, cofundador de GridMarkets

“En todo el mundo, la virtualización está ayudando a las empresas a mantener su productividad durante estos tiempos difíciles. Con las estaciones de trabajo virtuales Quadro en Oracle Cloud, los profesionales creativos y técnicos pueden acceder fácilmente al rendimiento que necesitan para trabajar en cualquier lugar”.
—Anne Hecht, directora sénior de marketing de productos de virtualización, NVIDIA
Investigación
La plataforma de supercomputación de Oracle Cloud Infrastructure brinda a los investigadores acceso a GPU NVIDIA bare metal, a instancias de computación de alto rendimiento y a una red de clústeres de baja latencia. Los investigadores pueden crear clústeres para ejecutar cálculos a gran escala que aceleren la investigación en múltiples ramas de la ciencia y la ingeniería, como el descubrimiento de fármacos, la genómica, la previsión meteorológica, la exploración espacial y más. A través de programas como Oracle for Research, Oracle está trabajando en estrecha colaboración con organizaciones de investigación como la Universidad de Bristol y la escuela Royal Holloway de la Universidad de Londres para ayudar a acelerar el desarrollo de vacunas y soluciones avanzadas que abordan el cambio climático.

“Podemos simular escenarios de captura de carbono, abordar problemas medioambientales complejos e impulsar cambios significativos en el mundo. Oracle nos ha ayudado a romper la barrera de la potencia de computación en el laboratorio&rdquo.
—Profesor Hier-Majumder, Royal Holloway, Universidad de Londres.
La investigación médica para ofrecer tratamiento a quienes presentan más riesgo de enfermedades se puede acelerar con soluciones de HPC que pueden ampliarse, admitir mucha información a la vez y responder a las necesidades de los investigadores. La Universidad de Bristol, en el Reino Unido, utiliza soluciones de Oracle HPC para analizar los datos de imágenes para la investigación médica.

“Tenemos la ambición de crear una plataforma para reaccionar rápidamente a las enfermedades, lo que implica la creación de terabytes de datos de imágenes. Con Oracle Cloud, podemos distribuir los datos en múltiples procesadores y obtener resultados en una fracción del tiempo que se requeriría en un sistema tradicional local”.
—Imre Berger, profesor de Bioquímica y Química, Universidad de Bristol
Almacenamiento de alto rendimiento
El rendimiento de los datos es extremadamente importante para que las aplicaciones de HPC funcionen de manera eficiente y permitan compartir datos en todo el clúster de computación. La carga y el almacenamiento de conjuntos de datos masivos durante el procesamiento requieren un sistema de archivos que pueda responder a las solicitudes de manera extremadamente rápida y fiable, con una capacidad de respuesta lineal y constante. Oracle Cloud ofrece varios modelos de sistemas de archivos HPC, como los sistemas de archivos de alto rendimiento GlusterFS, BeeGFS, Lustre e IBM Spectrum Scale con rendimiento estable y de alta velocidad.

“Mi equipo ha probado SAS Grid en muchas nubes públicas. Nos complace decir que la infraestructura de Oracle Cloud proporciona al sistema de archivos compartidos IBM Spectrum Scale el rendimiento de E/S que se necesita para SAS Grid”.
—Margaret Crevar, directora sénior, SAS Performance Lab, SAS

“Las tecnologías de redes de clústeres y computación bare metal de Oracle permitieron a BeeGFS en Oracle Cloud superar el rendimiento y la latencia del sistema de archivos HPC local para cargas de trabajo MPAS a un precio muy bajo. Con las redes de clústeres RDMA de Oracle Cloud, BeeGFS puede lograr un rendimiento de hasta 140 GB/s con tan solo 14 servidores”.
—Simon Ponsford, director técnico de YellowDog
Servicios de HPC en Oracle Cloud
Instancias de computación HPC bare metal
Las altas frecuencias de núcleo y las redes de clústeres brindan mejoras de rendimiento significativas a las instancias de computación bare metal de Oracle en comparación con otras nubes públicas y centros de datos in situ. Las instancias de computación bare metal proporcionan un aislamiento, visibilidad y control excepcionales.
Redes de clústeres
Si bien nuestros servidores bare metal estándar incluyen Ethernet dual de 25 Gbps para lograr una gran velocidad de la red, el innovador tejido de redes back-end de Oracle utiliza ConnectX-5 de Mellanox (tarjetas de interfaz de red de 100 Gbps que proporcionan RDMA sobre Ethernet convergente (RoCE) v2), que crea clústeres con la misma red de baja latencia y escalabilidad de aplicaciones que espera de sus clústeres locales.
GPU en máquinas virtuales y bare metal
Oracle Cloud pone a su disposición opciones de máquina virtual de alto rendimiento y basadas en NVIDIA bare metal que admiten cargas de trabajo con uso intensivo de gráficos para renderización, inteligencia artificial y cargas de trabajo de aprendizaje profundo.
Oracle Linux
Oracle Linux for High Performance Computing combina un entorno operativo totalmente compatible, abierto y completo que es totalmente compatible en binario con las aplicaciones de Red Hat Enterprise Linux. Oracle Linux ofrece herramientas de virtualización, gestión y computación nativa en la nube, junto con el sistema operativo (SO) Linux, en una única solución que cumple con los requisitos de computación de alto rendimiento. Los clientes que ejecutan HPC sobre Oracle Linux en Oracle Cloud obtienen ganancias de rendimiento impresionantes sin sacrificios ni costes de soporte. Con la simulación de fallos y las cargas de trabajo CFD, Oracle Linux proporciona una mejora de entre el 4 y el 6 % en los tiempos de simulación.
Sistemas de archivos HPC
El almacenamiento tradicional simplemente no puede proporcionar suficiente rendimiento para las cargas de trabajo de alto rendimiento que procesan grandes volúmenes de datos rápidamente. Para satisfacer estas necesidades, Oracle facilita la implementación de los sistemas de archivos de alto rendimiento GlusterFS, BeeGFS, Lustre e IBM Spectrum Scale, que pueden ofrecer un rendimiento agregado de hasta 453 GBps a los clústeres de HPC.
Soluciones de HPC listas para implementar
Implementación de clúster fácil y automatizada
Implemente clústeres de forma rápida y sencilla con los productos de Oracle Cloud Marketplace (plantilla Terraform), que incluyen todos los componentes clave para que pueda ponerse en marcha rápidamente. Los productos ofrecen la posibilidad de instalar el programador Slurm, OpenMPI y herramientas para probar la conectividad MPI.
Implementación sencilla del sistema de archivos
Oracle facilita la implementación de servidores de archivos de alto rendimiento líderes en la industria a escala de petabytes con productos de Oracle Cloud Marketplace, que incluyen automatización enraizada en mejores prácticas para reducir la complejidad y tiempo de implementación. Con solo unos pocos clics, los sistemas de archivos pueden estar en funcionamiento en menos de 15 minutos. Oracle Cloud Marketplace incluye productos fáciles de implementar que cubren BeeGFS, Lustre y GlusterFS, así como productos personalizables adicionales para cada sistema de archivos individual.
Máquinas virtuales para la ciencia de datos
Las Oracle Cloud Infrastructure Virtual Machines for Data Science son entornos preconfigurados que le permiten crear modelos y ofrecer valor empresarial más rápidamente. Ofrecen un rendimiento, seguridad y control excepcionales. Puede expandir sus recursos informáticos según sea necesario mediante el ajuste de escala de computación automático y puede mantener los costes bajo control al detener las instancias de computación cuando no son necesarias.
Puede tener una máquina virtual con una GPU NVIDIA en funcionamiento en menos de 15 minutos con los IDE, las libretas y los marcos comunes preinstalados. Las Oracle Cloud Infrastructure VMs for Data Science incluyen código y datos de muestra básicos para que los pruebe y explore.
Precio y rendimiento de Oracle Cloud HPC
Diseñamos nuestras instancias de HPC para las cargas de trabajo más intensivas en computación que requieren el rendimiento de un solo subproceso más rápido y la red de menor latencia. Todas las instancias de HPC tienen una única red de interconexión de memoria directa alimentada por una red RDMA bare metal y no virtualizada. Entregamos procesadores de alta frecuencia, almacenamiento local rápido y denso y una red de clústeres RDMA con una latencia superior a 2 microsegundos en clústeres de decenas de miles de núcleos. AWS no ofrece esta arquitectura y su solución más cercana, la C5n, es significativamente más cara.
Oracle Cloud Infrastructure BM.HPC2.36 | AWS c5n.metal | |
---|---|---|
Precio | $2.70 | 3888 USD (Este de EE. UU.) |
Almacenamiento | SSD locales NVMe | SSD NVMe no local |
Memoria | 384 GB | 192 GB |
Redes | RDMA | No RDMA |
SLA de rendimiento | Sí | No |
Pruebas comparativas | ||
SPECrate 2017 Integer | 238 | 237 |
SPECrate 2017 Floating Point | 206 | 206 |
Transmisión (MB/s) | 146,984 | 140,833 |
Resumen1 2 3 | Menores costes para un mejor rendimiento con RDMA y garantía de rendimiento | Un 44 % más caro, sin almacenamiento SSD local, la mitad de RAM, sin RDMA y sin SLA de rendimiento |

“Oracle Cloud Infrastructure y Rocky DEM han colaborado para proporcionar una experiencia escalable a los clientes con un rendimiento similar al de los clústeres locales. Los servidores GPU NVIDIA bare metal, sin sobrecarga de hipervisor, ayudan aún más a abordar problemas muy grandes en un período de tiempo razonable.”
—Marcus Reis, vicepresidente de ESSS