OCI, Zettascale10 및 Acceleron을 통해 최고 수준의 AI 성능 재정의

80만 개의 GPU 슈퍼클러스터, 새로운 고속 이더넷 기반 연결, 매우 유연한 소프트웨어 라이선스를 통해 OCI는 최고의 AI 성능 플랫폼으로 탈바꿈했습니다.

Alan Zeichick | 2025년 10월 16일


라스베이거스발. AI를 활용할 수 있는 클라우드 컴퓨팅 성능이 대거 지원됩니다. Oracle은 금주 AI World 컨퍼런스를 통해, 멀티가와트 클러스터에서 16 제타플롭스를 지원하는 OCI Zettascale10 슈퍼클러스터를 발표했습니다. 이 초대형 클라우드 제공업체는 고속 이더넷 기반 네트워크 상호 연결인 Oracle Acceleron과, 전례 없는 배포 옵션을 고객에게 제공하는 새로운 멀티클라우드 소프트웨어 라이선스 시스템도 출시했습니다.

Oracle Cloud Infrastructure(OCI)를 기반으로 구축된 Zettacale10 Supercluster는 여러 데이터 센터에 걸쳐 있으며 Oracle의 초저지연 InfiniBand 및 RoCE 기반 네트워크를 사용하여 최대 80만 개의 NVIDIA GPU를 통합합니다. InfiniBand는 슈퍼컴퓨터용 업계 표준 고속 상호 연결로, 한 서버가 직접 메모리 액세스(RDMA)를 사용하여 다른 서버의 메모리를 직접 읽거나 쓸 수 있도록 지원합니다. Oracle Acceleron RoCE(RDMA over Converged Ethernet) 네트워킹은 RDMA를 클라우드 컴퓨팅 클러스터로 확장하며 특히 AI 작업에 적합합니다.

OCI의 총괄 부사장인 Mahesh Thiagarajan은 "고객이 성능 단위당 전력 소모는 안정성은 높여 최대 규모의 AI 모델을 구축하고 훈련하고 배포할 수 있습니다."라며, "OCI Zettascale10를 통해 OCI의 획기적인 Oracle Acceleron RoCE 네트워크 아키텍처와 차세대 NVIDIA AI 인프라를 융합하여, 독보적인 규모의 멀티가와트 AI 용량을 제공하고 있습니다."라고 말했습니다.

Zettascale10의 힘은 단순히 제타플롭스(섹션당 부동 소수점 연산)나 기가 와트 단위로 측정되는 것이 아닙니다. Zettascale10 클러스터는 모두 대용량 광섬유 회선으로 서로 연결되어 여러 개의 고밀도 데이터 센터에 상주합니다. 즉, 가장 까다로운 AI 워크로드도 처리할 수 있는 슈퍼클러스터가 탄생한 것입니다.

최초의 Zettascale10 슈퍼컴퓨터는 텍사스주 애빌린의 대규모 기가와트 데이터 센터 캠퍼스에 있습니다.

컴퓨팅 패브릭을 확장하는 Acceleron RoCE

Zettascale10 슈퍼클러스터의 핵심은 최신 고속 네트워킹 상호 연결인 Oracle Acceleron RoCE 네트워크 패브릭입니다. 우수한 성능을 제공하지만 특수 하드웨어가 필요한 InfiniBand와는 달리, Acceleron은 OCI 데이터 센터 내 고성능 GPU를 연결하는 데에 특수 이더넷 네트워크 인터페이스 카드(NIC)와 케이블을 사용합니다. 이러한 특수 NIC에는 복잡한 대형 네트워크에서 트래픽 지연시간을 줄이도록 설계된 자체 4 포트 이더넷 스위치가 포함되어 있습니다.

"OCI는 여러 서비스의 모음이지만, 실제로는 하나의 통합체로 설계되었습니다. Oracle의 제품을 접하고 사용해 보면 가격 면에서, 프로비저닝하는 방법에서, 콘솔을 사용하는 방법에서, 모든 API가 함께 작동하는 방식에서, SDK를 다운로드하는 방식에서, 서비스가 실제로 작동하는 방식에서 설계의 통일성과 사용 편의성을 느끼실 수 있을 겁니다."

Clay Magouyrk Oracle CEO

Oracle은 Acceleron 네트워크 패브릭을 통해 고객이 대용량 AI 클러스터를 빠르고 저렴한 비용으로 배포할 수 있도록 지원합니다. 이는 GPU NIC를 여러 네트워크 스위치에 동시에 연결하여, 다수의 격리된 네트워크 평면으로 이루어진 분산형 네트워크 패브릭을 구축하는 방식입니다. 이 아키텍처를 통해 트래픽 흐름이 더욱 빠르게 이루어지므로 GPU는 데이터 전송 또는 수신 대기 중에도 중단되지 않습니다. 한 가지 장점은 효율성입니다. Zettascale10 슈퍼클러스터는 결과를 훨씬 더 빠르게 제공할 수 있습니다. 또 다른 이점은 예측 가능성입니다. 슈퍼컴퓨터 클러스터 전반에서 성능이 더 균일해지고, GPU간 지연시간이 짧아집니다. 통과할 스위치가 적기 때문입니다. 또한 사용률이 높아 네트워크 일부가 정지되는 경우에도 복원력이 좋아집니다. 마지막 이점은, Acceleron RoCE 패브릭은 하드웨어나 소프트웨어 유지 관리를 위해 하나의 네트워크 플레인을 서비스 중단하더라도 데이터 흐름을 유지한다는 것입니다.

Acceleron의 독보적인 아키텍처는 네트워크 전반에 걸쳐 회선 속도 암호화를 초저지연으로 제공합니다. 고객은 2배의 잠재 네트워킹 용량, 최대 2배의 스토리지 IOPS(초당 입출력)를 확보할 수 있습니다. 또한 호스트에(즉, 모든 Acceleron NIC와 네트워크의 모든 지점에) 제로 트러스트 패킷 라우팅(ZPR) 보안 정책이 직접 적용됩니다. 이 접근 방식의 장점 하나는, NIC 보안 정책을 활성화하면 인터넷을 통한 객체 스토리지 액세스를 차단하여 데이터 유출을 방지할 수 있다는 것입니다.

Oracle CEO인 Clay Magouyrk는 AI World 기조연설에서 말했습니다. "Acceleron은 Oracle의 모든 입출력 보안과 가속 기능의 토대입니다. 고객은 더 저렴한 비용, 더 나은 사용 편의성, 더 강력한 보안으로 더 높은 최고 성능을 경험하게 될 것입니다."

일원화된 구매 방식

Oracle, Amazon Web Services, Google Cloud, Microsoft Azure와 같은 초대형 클라우드 제공업체의 다양한 애플리케이션 및 서비스 웹을 이용하는 많은 고객은 클라우드 배포 과정이 복잡하다고 합니다. 조직의 기술적 요구 사항을 만족하기 위해 아키텍처가 복잡해야 하는 경우더라도, 서비스 라이선스만큼은 간단해야 합니다. 이 점에서 바로 새로운 Oracle Multicloud Universal Credits 프로그램이 유용할 수 있습니다.

고객은 이 프로그램을 통해 원하는 클라우드에서 Oracle Database 및 OCI 서비스를 구매할 수 있습니다. 크레딧은 Oracle Database@AWS, Oracle Database@Azure, Oracle Database@Google Cloud 및 OCI 자체에서 사용할 수 있습니다. 이를 통해 고객은 클라우드 전반에서 워크로드를 유연하게 배포하고 일관된 계약을 체결할 수 있습니다.

OCI의 수석 부사장인 Karan Batta는 "현재 37개의 멀티클라우드 리전이 AWS, Azure, Google Cloud 전반에 걸쳐 운영되고 있으며, 향후 출시될 Oracle Multicloud Universal Credits를 통해 계약을 간소화하고 업계 최초의 유연한 교차 클라우드 소비 모델을 도입함으로써 고객에게 그 어느 때보다 더 많은 선택지와 유연성을 제공하고 있습니다."라고 말합니다. 클라우드 전반에 걸쳐 하나의 라이선스와 소비 모델이 통용되므로 고객은 일관된 데이터베이스 경험뿐만 아니라 Oracle Applications 및 서비스에 대한 단일 관리 및 거버넌스 구조를 누릴 수 있습니다.

회사는 하이퍼스케일러 클라우드에서 원하는 OCI 서비스에 크레딧을 사용할 수도 있습니다.

엔터프라이즈 AI를 위한 새로운 성능 및 유연성 표준

Zettascale10 슈퍼컴퓨터와 Acceleron RoCE 네트워크 패브릭 기술을 통해 고객은 최대 80만 개의 GPU에서 대규모 AI 워크로드를 실행할 수 있습니다. Oracle Multicloud Universal Credits 프로그램을 통해 여러 클라우드에서 Oracle Database 서비스의 라이선스 및 사용이 그 어느 때보다 쉽고 간단해졌습니다. 이러한 발전을 통해 Oracle은 멀티클라우드 고객에게 효율성, 단순성, 유연성, 탁월한 성능 및 선택권을 제공합니다.


Oracle Connect 기사 더 읽어보기