Nissan Motor의 엔지니어들은 자동차 설계 및 개발 단계에서 대규모 컴퓨터 보조 엔지니어링(CAE) 및 고성능 컴퓨팅(HPC)을 사용합니다. 그러나 2050년까지 탄소 중립 및 무공해 자동차라는 목표를 달성하기로 결정한 Nissan Motor는 고성능 컴퓨팅 활용을 위한 보다 에너지 효율적인 방법을 찾아 나섰습니다.
지난 12월 26일 창립 90주년을 맞이한 닛산은 그간 자체 온프레미스 데이터 센터를 통해 CAE 및 HPC 활동을 지원해 왔습니다. 그러나 해당 인프라에서 소비되는 에너지는 이산화탄소 배출량을 줄이고자 하는 Nissan의 노력을 가로막는 장애물로 작용하였습니다.
Nissan의 엔지니어링 및 설계 시스템 부서의 Senior Manager인 Dai Matsubara는 "데이터센터의 에너지 소비량은 큰 걱정거리였습니다"라고 말합니다. "또한 일반적으로 제품 개발 프로젝트의 전환 과정에서 나타나는 컴퓨팅 리소스 수요의 큰 변동으로 인해 고가의 컴퓨팅 리소스를 구축해 두고도 정작 사용량은 많지 않은 시기가 발생하기도 했습니다."
따라서 Nissan의 경영진은 개발 및 테스트 환경을 보다 유연하고 확장 가능한 클라우드 컴퓨팅 환경으로 마이그레이션하여 기술 담당자들이 변화하는 컴퓨팅 수요에 신속하게 대응할 수 있게 됨과 동시에 에너지 소비량을 줄일 수 있는 방법을 검토해 보았습니다.
먼저 닛산의 기술팀은 가상 머신(VM) 전략을 사용하는 공급업체의 하이퍼스케일 클라우드 컴퓨팅 플랫폼 상에서의 설계 및 개발 활동을 시험해 보았습니다. 그러나 가상화 계층은 1,000건을 초과하는 병렬 연산을 수행할 때도 있는 대규모 시뮬레이션에 필요한 성능을 제공해 주지 못했습니다.
따라서 그 다음 차례로 Nissan의 기술진은 Oracle Cloud Infrastructure(OCI) 기반 베어메탈 인스턴스의 개념 증명(POC)을 위해 Oracle과 협업하였습니다. 가상화된 인스턴스와는 다르게, OCI Compute 베어메탈 인스턴스는 가상화 오버헤드가 발생하지 않는 완전 전용 서버의 모든 컴퓨팅 성능을 다양한 커스텀 애플리케이션에 부합하는 온디맨드 방식으로 제공해 주었습니다.
“Nissan은 클라우드 퍼스트/멀티클라우드 전략의 일환으로 고성능 베어메탈 인스턴스를 제공하는 OCI 기반 HPC를 선택했습니다. 매일같이 증가하는 시뮬레이션 수요와 지속적 비용 절감이라는 세계적 규모의 도전 과제들을 한 번에 해결할 수 있는 묘수였죠. 예상대로 Oracle Cloud HPC는 Nissan에 큰 투자 효용을 선사했습니다.”
OCI는 원격 직접 메모리 액세스(RDMA) 클러스터 네트워크 기반 베어메탈 HPC를 가장 먼저 출시한 퍼블릭 클라우드 중 하나입니다. Nissan은 POC를 통해 OCI가 과거 다른 클라우드 제공업체와 테스트했던 가상 머신 서비스와 비슷한 가격으로 자사의 기대치를 뛰어넘는 성능을 제공한다는 사실을 확인했습니다.
Nissan의 기술 담당자들은 Oracle 전문가들과 협력하여 각종 요구 사항을 정의하고 필요한 기능들을 사용자화하는 단계로부터 전체 프로젝트 구현 단계에 이르는 모든 마이그레이션 과정을 함께 진행했습니다. "마이그레이션 프로세스는 매우 순조로웠습니다." Matsubara는 말합니다. "Nissan의 내부 팀은 Oracle의 지원 담당자들과 빠르게 협력 관계를 구축했습니다. 프로젝트는 두 달 정도밖에 걸리지 않았고 큰 문제도 발생하지 않았습니다."
Nissan은 전 세계의 Nissan 엔지니어들이 사용하는 40개 이상의 커스텀 CAE 애플리케이션을 OCI Compute 베어메탈 인스턴스로 마이그레이션했습니다.
이제 Nissan은 때로 수만 개의 코어가 필요한 경우도 있는 피크타임의 워크로드를 온프레미스 데이터센터보다 저렴한 비용으로 더욱 뛰어난 성능과 유연성을 제공하는 클라우드 플랫폼 상에서 처리할 수 있게 되었습니다. 각 CAE 애플리케이션의 구동을 위한 가상 데스크톱 인프라에 사용되는 NVIDIA A10 GPU는 초당 100Gb/s의 대역폭을 제공함으로써 지연 시간을 최소화해 줍니다.
OCI의 자동 확장 기능이 Nissan의 컴퓨팅 인스턴스 수를 자동으로 조정해 주므로 컴퓨팅 수요가 많은 기간에는 최종 사용자들이 필요로 하는 성능을 일관적으로 제공하고, 수요가 적은 기간에는 컴퓨팅 비용을 절감할 수 있습니다. 기술 담당자는 더 많은 노드가 필요해지면 자동으로 사용을 시작하고 더 이상 필요하지 않은 노드는 즉시 사용을 종료하도록 설정할 수 있습니다.
OCI가 제공하는 고도의 병렬 컴퓨팅을 통한 획기적 성능 향상은 다양한 시뮬레이션 속도를 가속화하고 엔지니어의 생산성을 향상시킬 뿐만 아니라, 애플리케이션 라이선스 비용의 절감에도 기여합니다. Nissan이 사용 중인 CAE 애플리케이션 중 일부는 시간당 사용료가 청구되는 종량제 방식으로 제공되고 있으며, 해당하는 라이선스 비용은 할당된 CPU 코어 수에 따라 변화합니다. OCI Compute 베어메탈을 사용하게 된 이래로 Nissan의 시뮬레이션 실행 횟수는 증가했지만 라이선스 비용은 증가하지 않았습니다. 전반적으로 OCI 솔루션은 Nissan의 과거 온프레미스 환경보다 약 30% 저렴합니다.
Matsubara는 "Nissan은 이미 AI 및 ML 기술을 활용하여 지속 가능한 모빌리티 및 혁신적인 디자인이라는 목표를 달성하기 위한 방법을 모색하고 있습니다"라고 말합니다. "Oracle과 OCI는 해당 목표들의 달성 과정에서 핵심적인 역할을 수행할 것입니다."
자동차 제조업체는 클라우드 기술을 사용하여 물리적 충돌 테스트 빈도를 줄일 수 있습니다.
OCI 기반 HPC가 우리 회사의 HPC 워크로드에 적합한 솔루션인 이유를 확인해 보세요.