오라클 클라우드 HPC 솔루션은 온프레미스 솔루션의 성능과 클라우드의 탄력성 및 소비 기반 비용을 결합하여 고객이 자본 집약적인 온프레미스 시스템에서 마이그레이션하거나 보완할 수 있는 옵션을 제공합니다. 오라클 클라우드 인프라스트럭쳐(OCI) HPC 플랫폼에는 베어 메탈 컴퓨팅 인스턴스, RDMA용 대기 시간이 짧은 클러스터 네트워크, 고성능 스토리지 솔루션 및 파일 시스템, 네트워크 트래픽 격리 및 클라우드에서 작업을 원활하게 자동화하고 실행하는데 필요한 도구가 포함됩니다. 자동차 산업의 충돌 시뮬레이션에서 석유 및 가스 회사의 지진 분석, 미디어 회사의 특수 효과 렌더링에 이르기까지 Oracle의 클라우드 기반 인프라를 통해 고객은 복잡한 기술 문제를 더 빠르게 해결할 수 있습니다.
산업별 솔루션
Oracle은 기존의 온프레미스 시스템에 의존하여 적시에 결과를 달성하는 엔터프라이즈급 고객의 요구를 지원하기 위해 클라우드에 인프라와 서비스를 구축했습니다. Oracle을 사용하면 고객은 긴 대기 시간과 잠재적인 설계 지연을 방지하고 대신 제품 개발, 위험 측정, 경험 제공 및 산업 혁신 방법을 재창조하는 데 집중할 수 있습니다.
제조 산업에서의 CFD(전산 유체 역학)
Altair의 이미지 제공CFD(전산 유체 역학)는 제품 엔지니어링을 단순화하고 가속화하기 위해 공기와 유체의 움직임을 시뮬레이션하는 일반적인 워크로드입니다. 예를 들어, 자동차 부문에서는 제조업체가 실내 공기 흐름, 엔진 오일 역학 및 자동차 주변의 공기 흐름을 시뮬레이션하여 연비를 개선하는 데 도움이 됩니다. Oracle의 100Gbps 클러스터 네트워킹, 고주파수 Intel 프로세서 기반 컴퓨팅 인스턴스 및 최신 NVIDIA GPU의 혜택을 받는 긴밀하게 결합된 MPI 기반 워크로드입니다. Oracle HPC는 AWS가 제공하는 것보다 44% 저렴합니다.
출처: 일본 개방성 CAE 학회

“오라클 클라우드 HPC 솔루션에는 세 가지 주요 이점이 있습니다. 저비용, 고성능 및 최신 기술 지원입니다. Denso Techno는 오라클 클라우드 HPC 솔루션을 사용하여 기본 기술을 구축합니다.”
—Koji Komura, Denso Techno Co., Ltd.의 DX 추진 센터 VE 개발 부서 총괄 관리자

“Oracle과 협력하여 오라클 클라우드 인프라스트럭쳐(OCI)에서 고객에게 CONVERGE를 제공하게 되어 기쁩니다. 오라클 클라우드 인프라스트럭쳐(OCI)의 베어 메탈 HPC 형태와 대기 시간이 짧은 RDMA(원격 직접 메모리 액세스) 네트워킹을 통해 CONVERGE를 위한 뛰어난 확장성을 얻을 수 있었습니다.”
—Dr. Kelly Senecal, Convergent Science의 소유자 겸 부사장
아래 그래프는 오라클 클라우드 인프라스트럭쳐(OCI)의 CONVERGE 3.0을 보여 주며, 1억 7천만 셀을 사용하여 부분적으로 혼합된 난기류 연소를 위한 Sandia Flame D 시뮬레이션을 4,000코어에 이르는 거의 이상적인 선형 확장으로 제공합니다.
Nissan은 CFD(전산 유체 역학) 워크로드를 실행할 최적의 장소가 필요했을 때 오라클 클라우드 인프라스트럭쳐(OCI)를 선택했습니다. Nissan은 디지털 제품 디자인에 의존하여 자동차의 연비, 신뢰성 및 안전성을 개선하기 위해 빠르고 중요한 디자인 결정을 내립니다. 컴퓨팅 집약형이고 지연 시간에 민감한 CFD 시뮬레이션은 이러한 효율성을 달성하기 위해 매우 중요합니다. 이러한 워크로드를 오라클 클라우드 인프라스트럭쳐(OCI)로 마이그레이션함으로써 Nissan은 클라우드 유연성과 함께 온프레미스 수준의 성능을 얻습니다.

“우리는 지속적인 비용 절감의 압력 속에서 늘어가는 시뮬레이션 수요 문제를 해결하기 위해 멀티 클라우드 전략의 일환으로 오라클 클라우드 인프라스트럭쳐(OCI)의 HPC 솔루션을 선택했습니다. Oracle이 Nissan에 상당한 ROI를 가져올 것이라고 믿습니다.”
—Bing Xu, Nissan Motor Co, Ltd의 엔지니어링 시스템 부서 총괄 관리자

“전산 유체 역학(CFD)의 세계에서는 제품 설계 속도를 가속화해야 한다는 끊임없는 압력이 있으며 오늘날 우리 고객은 몇 주가 아닌 몇 시간 만에 고성능 시뮬레이션을 경험할 수 있습니다. 오라클 클라우드 인프라스트럭쳐(OCI)에서 Simcenter STAR-CCM+를 실행함으로써 고객은 막대한 비용의 하드웨어 투자나 솔루션 정확도의 손상 없이 시뮬레이션을 빠르고 쉽게 확장할 수 있습니다. 우리의 고객은 더 저렴한 비용으로 온프레미스와 동일한 성능과 확장성을 확보하여 더 나은 엔지니어링 결정을 더 신속하게 내릴 수 있습니다.”
—Keith Foston, Siemens 클라우드 제품 관리자
제조 산업에서의 디지털 트윈 제품 엔지니어링 및 테스트
디지털 트윈은 일반적으로 실제 제품을 생산하기 전에 프로토 타입 설계 및 테스트 속도를 높이는 데 사용됩니다. 제조업체는 다양한 PLM(제품 수명 관리) 및 엔지니어링 시뮬레이션 소프트웨어 패키지를 사용하며, 이들 모두 중요한 CPU 기반 또는 GPU 기반 컴퓨팅 리소스가 필요합니다.
Altair AcuSolve는 RDMA용 클러스터 네트워크를 사용하여 오라클 클라우드 인프라스트럭쳐(OCI)에서 거의 이상적인 수준의 노드 수로 성능을 확장할 수 있습니다.
딥 러닝 및 GPU 가속 컴퓨팅
고객 데이터에서 사물 인터넷(IoT)에 이르는 비즈니스 데이터가 폭발적으로 증가함에 따라 데이터 과학자는 기존의 온프레미스 IT 하드웨어가 제공할 수 있는 것보다 더 많은 유연성을 가지고 딥 러닝 모델을 신속하게 탐색하고 구축할 수 있는 유연함이 필요합니다. 오라클 클라우드는 딥 러닝을 위한 GPU 컴퓨팅 인스턴스, 배포하기 쉬운 이미지, 단일 GPU 워크 스테이션 또는 다중 GPU 형태의 클러스터를 실행할 수 있는 유연성을 제공합니다.
시각적 인식, 딥 러닝 모델은 여러 오라클 클라우드 인프라스트럭쳐(OCI) 기능과 혁신에서 이점을 얻습니다. 여기에는 최대 8개의 GPU를 갖춘 알려진 NVIDIA A100 Tensor Core GPU 컴퓨팅 인스턴스와 2.9GHz에서 실행되는 최신 2세대 AMD EPYC 프로세서, 최대 64개의 물리적 코어, 그리고 대량의 체크 포인트에 의존하는 워크로드를 위한 짧은 대기 시간을 갖는 데이터 액세스용 로컬 NVMe 스토리지가 포함된 NVLink가 포함됩니다. 이러한 GPU 인스턴스는 오라클 클라우드 인프라스트럭쳐(OCI)에서 클러스터 네트워킹 지원 및 고객이 2마이크로 초 미만의 지연 시간과 결합된 1.6Tbps의 대역폭으로 MPI 워크로드를 실행할 수 있는 100Gbps RDMA 상호 연결을 지원하는 최초가 될 것입니다.
“오라클 클라우드 인프라스트럭쳐(OCI)는 새로운 NVIDIA Tesla 클라우드 솔루션을 최초로 선보였습니다. Tensor 코어는 약 125 테라플롭스를 실행하지만 약 300 와트의 전력만을 사용합니다. 이를 통해 이전에 수행한 작업보다 훨씬 앞서 모델과 데이터 세트를 실행할 수 있으며, 이전에는 볼 수 없었던, 인간에게는 분명하지 않은 패턴을 볼 수 있습니다. 머신 러닝으로 실행한 최초 모델은 당시 생산 중인 모델 버전보다 40% 더 정확했습니다. 우리는 몇 시간이 걸릴 것으로 예상했지만 몇 분 밖에 걸리지 않았습니다.”
—James Kelloway, National Grid ESO 에너지 인텔리전스 관리자
고주파 알고리즘 거래
거래 애플리케이션을 포함한 재무 애플리케이션에는 매우 일관되고, “낮은 지터” 성능을 제공하는 저지연성 고성능 인프라가 필요합니다. 이러한 애플리케이션은 초기 클라우드 아키텍처의 설계 목표가 아니었으며 클라우드로의 이동 속도가 느렸습니다. 오라클 클라우드 인프라스트럭쳐(OCI)는 이러한 애플리케이션에 필요한 2 마이크로초 미만의 클러스터 내 지연 시간, 맞춤형 구축 및 고가의 온프레미스 솔루션에 필적하며 고객이 이러한 애플리케이션을 활성화하는데 필요한 결과를 제공하는 것과 같은 성능 특성을 제공합니다.
“오라클 클라우드 인프라스트럭쳐(OCI)는 매우 높은 메시지 볼륨에서 10μs 수준의 결정적인 대기 시간을 지원할 수 있습니다. 짧은 대기 시간에 민감한 애플리케이션을 OCI에 배포하는 것을 정당화할 수 있는 충분한 증거가 있습니다. 이러한 서비스 수준이 요구되는 서비스는 비용이 많이 드는 현장 배포를 방지하기 때문에 매우 중요합니다.”
—Larry Ryan, BJSS 최고 기술 책임자
시각 효과 렌더링
고성능 컴퓨팅은 좋아하는 블록버스터 영화의 특수 효과부터 TV 광고, 최신 PC 및 콘솔 게임 타이틀에 이르기까지 오늘날 편재하는 시각 효과를 위한 능력을 제공하며, 모두 주문형 HPC 및 GPU 성능이 필요한 미디어 회사에서 개발했습니다. OCI의 성능 면에서 NVIDIA Quadro 가상 워크 스테이션은 고가의 고급 그래픽 워크 스테이션에 버금가지만 Oracle를 사용하면 시간당 몇 달러로 이 성능에 액세스할 수 있습니다. 아래에서는 SPECviewperf 13 벤치 마크 결과를 공유합니다. 다음을 사용하여 직접 실행해 보십시오. 오라클 클라우드에서 GPU 프로비저닝 및 사용 가능한 벤치 마크 실행.
사용자에게 이것이 어떻게 수행되는지 이해하기 위해 하나의 NVIDIA P100 GPU를 제공하는 VM.2.1 GPU 형태에서 SPECviewperf® 13 벤치 마크를 실행하고 이를 P2000이 구동하는 워크스테이션과 비교했습니다. SPECviewperf® 13 벤치 마크는 전문 애플리케이션을 기반으로 그래픽 성능을 측정하기 위한 세계 표준입니다.

“오라클 클라우드 인프라스트럭쳐(OCI)를 사용하면 요청을 대기열에 넣거나 렌더링을 예약할 필요가 없습니다. 고객은 사용하지 않은 용량에 대해 비용을 지불하지 않고도 필요할 때마다 무제한의 머신에 액세스 할 수 있습니다.”
—Mark Ross, GridMarkets 공동 창립자

“전 세계적으로 가상화는 이 어려운 시기에 기업이 생산성을 유지할 수 있도록 해줍니다. 오라클 클라우드의 Quadro 가상 워크 스테이션을 사용하면 창의적이고 기술적인 전문가가 작업에 필요한 성능에 어디서나 쉽게 액세스할 수 있습니다.”
—Anne Hecht, NVIDIA 가상화 제품 마케팅 수석 이사
연구
오라클 클라우드 인프라스트럭쳐(OCI)의 슈퍼 컴퓨팅 플랫폼은 연구자들에게 베어 메탈 NVIDIA GPU, 고성능 컴퓨팅 인스턴스 및 대기 시간이 짧은 클러스터 네트워크에 대한 액세스를 제공합니다. 연구원은 대규모 계산을 실행하기 위한 클러스터를 생성하여 신약 발견, 유전체학, 일기 예보, 우주 탐사 등과 같은 여러 과학 및 공학 분야의 연구를 가속화할 수 있습니다. Oracle for Research와 같은 프로그램을 통해, Oracle은 브리스톨 대학교 및 런던 로열 홀러웨이 대학교와 같은 연구 기관과 긴밀히 협력하여 기후 변화를 해결하는 백신 및 고급 솔루션 개발을 가속화하고 있습니다.

“우리는 탄소 포집 격리 시나리오를 시뮬레이션하고 복잡한 환경 문제를 해결하며 세계의 의미 있는 변화를 주도할 수 있습니다. Oracle은 연구실에서의 컴퓨팅 능력의 장벽을 허물도록 도와주었습니다.&rdquol
—런던 Royal Holloway 대학교 Hier-Majumder 교수.
잠재적 질병의 후보군을 제공하기 위한 의료 연구를 가속화하는 것은 연구자의 요구에 부응하고 확장하며 대응할 수 있는 HPC 솔루션을 통해 달성할 수 있습니다. 영국 브리스톨 대학교는 Oracle HPC 솔루션을 사용하여 의료 연구용 이미징 데이터를 분석합니다.

“우리의 목표는 테라 바이트의 영상 데이터 생성과 관련된 폐해에 신속하게 대응할 수 있는 플랫폼을 만드는 것입니다. 오라클 클라우드를 사용하면 데이터를 여러 프로세서에 분산할 수 있어 기존의 온프레미스 시스템보다 훨씬 짧은 시간에 결과를 얻을 수 있습니다.”
—Imre Berger, 브리스톨 대학교 생화학 및 화학 교수
고성능 스토리지
데이터 처리량은 HPC 애플리케이션이 효율적으로 작동하고 컴퓨팅 클러스터에서 데이터 공유를 활성화하는데 매우 중요합니다. 처리 중 방대한 데이터 세트를 로드하고 저장하려면 요청에 대해 일관되고 선형적인 응답을 사용하여, 매우 빠르고 안정적으로 응답할 수 있는 파일 시스템이 필요합니다. 오라클 클라우드는 GlusterFS, BeeGFS, Lustre 및 IBM Spectrum Scale 고성능 파일 시스템을 포함한 여러 HPC 파일 시스템 모델을 안정된 고속 처리량으로 제공합니다.

“우리 팀은 많은 퍼블릭 클라우드에서 SAS Grid를 테스트 했습니다. 오라클 클라우드’의 인프라로 SAS Grid에 필요한 IBM Spectrum Scale 공유 파일 시스템에 I/O 처리량을 제공할 수 있게 되어 기쁩니다.”
—Margaret Crevar, SAS Performance Lab 선임 관리자

“Oracle’의 베어 메탈 컴퓨팅 및 클러스터 네트워킹 기술을 통해 오라클 클라우드의 BeeGFS는 매우 저렴한 가격으로 MPAS 워크로드에 대한 온프레미스 HPC 파일 시스템 대기 시간 및 처리량을 능가할 수 있었습니다. 오라클 클라우드’의 RDMA 클러스터 네트워킹을 사용하는 BeeGFS는 최소 14대의 서버로 최대 140GB/s의 성능을 보여줄 수 있습니다.”
—Simon Ponsford, YellowDog 최고 기술 책임자
오라클 클라우드의 HPC 서비스
베어 메탈 HPC 컴퓨팅 인스턴스
Oracle의 베어 메탈 컴퓨팅 인스턴스는 높은 코어 주파수와 클러스터 네트워킹으로 다른 퍼블릭 클라우드 및 온사이트 데이터 센터에 비해 상당한 성능 향상을 제공합니다. 베어 메탈 컴퓨팅 인스턴스는 우수한 격리성, 가시성 및 제어 기능을 제공합니다.
클러스터 네트워킹
표준 베어 메탈 서버에는 빠른 네트워킹을 위한 듀얼 25Gbps 이더넷이 포함되어 있지만 Oracle’의 혁신적인 백엔드 네트워크 패브릭은 Mellanox’의 ConnectX-5, 100Gbps 네트워크 인터페이스 카드를 통해 RoCE(RDMA over Converged Ethernet) v2를 제공하여 온프레미스 클러스터에서 기대하는 것과 동일한 저지연 네트워킹 및 애플리케이션 확장성을 갖춘 클러스터를 생성합니다.
베어 메탈 및 VM의 GPU
오라클 클라우드에는 렌더링, AI 및 딥 러닝 워크로드를 위한 그래픽 집약적 워크로드용 고성능 가상 머신 및 베어 메탈 NVIDIA 기반 옵션이 있습니다.
Oracle Linux
고성능 컴퓨팅을 위한 Oracle Linux는 100% 애플리케이션 바이너리를 지원하는 완벽 지원, 개방성 및 완벽한 운영 환경을 Red Hat Enterprise Linux와 결합합니다. Oracle Linux는 가상화, 관리 및 클라우드 네이티브 컴퓨팅 도구를— Linux 운영 체제(OS)와 함께— 고성능 컴퓨팅 요구 사항을 충족하는 단일 제품으로 제공합니다. 오라클 클라우드의 Oracle Linux에서 HPC를 실행하는 고객은 어떠한 희생이나 지원 비용없이 인상적인 성능 향상을 경험하고 있습니다. 충돌 시뮬레이션 및 CFD 워크로드를 통해 Oracle Linux는 시뮬레이션 시간을 4~6% 개선합니다.
HPC 파일 시스템
기존 스토리지는’ 대용량 데이터를 빠르게 처리하는 성능 집약적 워크로드에 충분한 처리량을 제공할 수 없습니다. 이러한 요구를 충족하기 위해 Oracle을 사용하면 HPC 클러스터에 최대 453GBps의 총 처리량을 제공할 수 있는 GlusterFS, BeeGFS, Lustre 및 IBM Spectrum Scale 고성능 파일 시스템을 쉽게 배포할 수 있습니다.
HPC 솔루션 배포 준비
쉽고 자동화된 클러스터 배포
모든 주요 구성 요소가 포함된 Oracle Cloud Marketplace 스택(Terraform 템플릿)을 사용하여 신속하고 쉽게 클러스터를 배포하고 빠르게 실행할 수 있습니다. 스택은 Slurm 스케줄러, OpenMPI 및 도구를 설치하여 MPI 연결을 테스트하는 기능을 제공합니다.
간편한 파일 시스템 배포
Oracle을 사용하면 Oracle Cloud Marketplace 스택을 사용하여 페타바이트 규모로 업계 최고의 고성능 파일 서버를 쉽게 배포할 수 있습니다. 여기에는 복잡성과 및 배포 시간을 줄이기 위한 모범 사례에 기반한 자동화가 포함됩니다. 몇 번의 클릭만으로 15분 이내에 파일 시스템을 가동하고 실행할 수 있습니다. Oracle Cloud Marketplace에는 BeeGFS, Lustre 및 GlusterFS를 포괄하는 배포하기 쉬운 스택과 각 개별 파일 시스템에 대한 추가 사용자 지정 가능 스택이 포함되어 있습니다.
데이터 사이언스용 VM
오라클 클라우드 인프라스트럭쳐(OCI) 데이터 과학용 가상 머신은 모델을 구축하고 비즈니스 가치를 더 빠르게 제공할 수 있도록 사전 구성된 환경입니다. 뛰어난 성능, 보안 및 제어 기능을 제공합니다. 컴퓨팅 자동 확장을 사용하여 필요에 따라 컴퓨팅 리소스를 확장하고 필요하지 않은 컴퓨팅 인스턴스를 중지하여 비용을 제어할 수 있습니다.
사전 설치된 공통 IDE, 노트북 및 프레임 워크를 사용하여 15분 이내에 NVIDIA GPU가 있는 가상 머신을 가동하고 실행할 수 있습니다. 데이터 과학용 오라클 클라우드 인프라스트럭쳐(OCI) VM에는 테스트하고 탐색할 수 있는 기본 샘플 데이터와 코드가 포함되어 있습니다.
오라클 클라우드 HPC 가격 대비 성능
가장 빠른 단일 스레드 성능과 가장 낮은 대기 시간 네트워크가 필요한 가장 계산 집약적인 워크로드를 위해 HPC 인스턴스를 설계했습니다. 모든 HPC 인스턴스에는 가상화되지 않은 베어 메탈 RDMA 네트워크로 구동되는 고유한 직접 메모리 방식의 상호 연결 네트워크가 있습니다. 우리는 수 만개의 코어 클러스터에서< 2 마이크로 초의 지연 시간을 가진 고주파 프로세서, 빠르고 밀집된 로컬 스토리지 및 RDMA 클러스터 네트워크를 제공합니다. AWS는 이러한 아키텍처를 제공하지 않으며 가장 근접한 솔루션인 C5n은 훨씬 더 비쌉니다.
오라클 클라우드 인프라스트럭쳐(OCI) BM.HPC2.36 | AWS c5n.metal | |
---|---|---|
정가 | $2.70 | $3.888(미국 동부) |
스토리지 | 로컬 NVMe SSD | 로컬 NVMe SSD 없음 |
메모리 | 384GB | 192GB |
네트워킹 | RDMA | RDMA 없음 |
SLA 성능 | 예 | 아니요 |
벤치 마크 | ||
SPECrate 2017 정수 | 238 | 237 |
SPECrate 2017 부동 소수점 | 206 | 206 |
스트림(MB/s) | 146,984 | 140,833 |
요약1 2 3 | RDMA 및 성능 보장으로 성능 향상을 위한 비용 절감 | 44% 더 비싼 가격, 로컬 SSD 스토리지 없음, 절반에 해당하는 RAM, RDMA 및 성능 SLA 없음 |

“오라클 클라우드 인프라스트럭쳐(OCI)와 Rocky DEM은 온프레미스 클러스터와 유사한 성능으로 고객에게 확장 가능한 경험을 제공하기 위해 협력했습니다. 하이퍼바이저 오버헤드의 염려가 없는 베어 메탈 NVIDIA GPU 서버는 합리적인 시간 내에 상당히 큰 문제를 해결하는데 도움이 됩니다.”
—Marcus Reis, ESSS 부사장