Caltech, 암 치료 연구에 Oracle Cloud 활용

세계적으로 유명한 교육 및 연구 기관인 Caltech은 Oracle GPU 인스턴스를 사용하여 새로운 암 치료법 개발에 기여할 ML 기반 모델을 구축하고 있습니다.

Jim Lein | 2024년 1월 19일


California Institute of Technology의 연구원 Matt Thomson은 빅데이터를 이용한 새로운 암 치료법을 개발하고 있습니다. 대규모 암 환자 데이터에 머신러닝(ML) 모델을 적용하여 가장 치료하기 어려운 종류의 종양들에 대한 새로운 치료법을 찾아내려는 것입니다.

Thomson은 "신체의 면역 체계가 종양을 공격하도록 유도하여 암을 치료할 수 있다는 것은 잘 알려진 사실입니다."라며, "그러나 이는 일부 최악의 암들의 경우 효과를 볼 수 없는 전략이기도 하죠. 따라서 우리는 머신러닝을 사용하여 이같은 치료법이 효과가 있는 환자 및 없는 환자 모두와 관련된 데이터를 두루 살펴보며 새로운 치료법을 설계하고 있습니다."라고 말했습니다.

Thomson은 비공식적으로 Thomson Lab이라고도 불리는 Caltech의 Single-Cell Profiling and Engineering Center의 선임 연구원입니다. Thomson과 그의 산하 팀은 단백질 공학이라고 불리는 프로세스를 위한 대규모 언어 머신러닝 모델을 구축 및 적용하기 위해 매우 다양한 데이터 세트를 통합하고 분석합니다.

해당 머신러닝 모델에는 최대 1,000억 개의 매개변수가 포함되고, 이를 대규모로 호스팅, 실행, 미세 조정하기 위해서는 분산 컴퓨팅에 대한 전문 지식이 필요합니다. 각 모델은 단백질 설계-테스트 주기 동안 수천 번 실행되어야 합니다. 단백질 설계는 단일 머신러닝 모델 뿐만 아니라, 면역 조절(면역 반응 감소 또는 강화) 및 열 안전성(적당한 열이 가해진 물질의 특성 유지 능력)과 같은 다운스트림 애플리케이션들에 특화된 모델 라이브러리를 함께 필요로 합니다. 따라서 Thomson Lab은 대규모 모델을 실행하고 테스트하기에 충분한 고성능 컴퓨팅(HPC) GPU를 확보한다는 도전 과제를 해결해야 했습니다.

"단일 GPU로는 1,000억 개의 매개변수를 처리할 수 없었습니다." Thomson은 말합니다. "우리의 목적에 적합하고 탄력적인 HPC 리소스에 액세스하기 위해서는 다년간의 계약을 맺어야 했죠. 학계에서 그같은 수준의 자금을 확보하기란 거의 불가능한 일이었습니다."

새로운 치료법 개발을 지원하는 클라우드 컴퓨팅

과거에는 개인 연구자 및 연구 기관이 이같은 연구에 특화된 컴퓨터를 직접 구축했지만, 기껏 구축한 컴퓨터는 단 몇 달 만에 구식이 되어 버리곤 했습니다. 근래에는 칼텍의 자체 HPC 클러스터를 사용하기도 했으나 연구가 진행됨에 따라 그같이 강력한 시스템조차도 충분하지는 않다는 사실만이 입증되었습니다.

결과적으로 Thomson은 클라우드로 눈을 돌렸습니다. 모 유명 클라우드 인프라 제공업체와 함께했던 첫 클라우드 사용 시도는 숨겨진 비용 및 내부적 관리 부담으로 인해 난관에 부딪혔습니다. 이후 Thomson은 개인적 인맥을 통해 Oracle의 AI 및 ML 팀원들과 협력하여 Oracle Cloud Infrastructure(OCI) GPU 인스턴스에서 모델을 생성하고 테스트하기 위한 개념 증명(PoC)을 설계할 수 있었습니다.

언제든 최신 GPU 인스턴스에 액세스할 수 있는 OCI는 최신 기술을 활용한 치료법 연구를 위한 가장 실용적인 플랫폼입니다. 조만간 클라우드 서비스가 온프레미스 HPC 클러스터를 활용하는 머신러닝 연구를 완전히 대체하게 될 것입니다.”

Matt Thomson California Institute of Technology, Assistant Professor of Computational Biology

Thomson Lab은 하나의 모델을 학습시킬 때마다 약 20테라바이트의 총 데이터베이스 중 약 80기가바이트의 데이터를 GPU 메모리로 가져와 보관합니다. PoC 과정에서는 도합 1,000개의 모델을 생성할 수 있었습니다. OCI로 눈을 돌리기 전, Thomson Lab은 단 10개 모델만을 동시에 테스트할 수 있었습니다.

"PoC 과정에서 Oracle은 매우 협력적이었고, Oracle 팀은 우리의 연구를 발전시키기 위해 계속해서 함께 노력해 주었습니다." Thomson은 말했습니다. "다른 클라우드 공급업체들은 고객을 모집하는 단계에서는 이런저런 인센티브를 제공하지만, 계약이 성사된 뒤부터는 우리같은 소규모 고객과의 협력에 별다른 관심을 보이지 않죠."

다음 도전 과제: 방대한 데이터를 어떻게 활용할 것인가

오늘날의 생물학 연구자들은 갈수록 많은 양의 데이터를 새로운 수학적 모델과 통합해야 합니다. 과거의 연구자들은 전문가 수준의 데이터베이스 대신 저렴한 오픈 소스 데이터베이스 서비스를 사용했습니다.

예를 들어, Thomson Lab은 최대 1,000만 개 행 및 3만 개 열로 구성된 100개 이상의 데이터 세트를 사용하여 작업하고 있으며, 매주 약 20테라바이트의 새로운 데이터를 생성합니다. 현재 각각의 데이터 세트는 로컬 하드 드라이브에 CSV 파일 형식으로 개별 저장하고 있습니다. 그러나 Caltech의 모든 데이터 세트 및 다른 연구 기관의 데이터 세트를 저장할 수 있는 데이터 저장 및 관리 시스템 없이는 사용 가능한 모든 관련 정보를 사용하여 머신러닝 모델을 학습시킬 수 없습니다.

따라서 Thomson Lab은 Oracle과 협력하여 모든 데이터 세트를 보관하고, 모든 기관의 연구자들이 동적으로 액세스할 수 있는 데이터 스토리지 및 관리 시스템을 개발하는 것을 앞으로의 연구를 위한 이상적인 방안으로 여기고 있습니다.

Thomson은 Caltech과 Oracle의 협력이 암 연구 및 치료 분야의 획기적인 발전을 이끌 것이라고 낙관하고 있습니다.

"모든 도구가 준비되었습니다." Thomson은 말합니다. "우리는 Oracle과 협력하여 모든 연구 시스템을 통합하고, 상호 합의된 수익화 모델을 통해 해당 서비스를 저렴하게 이용할 수 있는 구조를 함께 만들어 나가고자 합니다. 이는 Caltech뿐만 아니라 비슷한 규모의 모든 연구 기관들에게 좋은 선례가 될 것입니다. Caltech과 Oracle은 이제부터 수많은 성과를 함께 거두게 될 것입니다."


Oracle Connect 기사 더 읽어보기