Michael Chen | Content Strategist | 2023년 12월 6일
대중매체에서 AI는 때로 부정적으로 그려집니다. 영화는 AI를 로봇 대재앙의 첫 번째 단계로 묘사하고, 뉴스는 AI가 우리의 일자리를 모두 빼앗을 것이라는 이야기로 가득 차 있습니다. 사실 AI는 이미 오래전부터 존재해 왔으며, 이같은 최악의 시나리오 중 어느 것도 임박한 상황은 아닙니다.
기본적으로 AI는 데이터를 사용해 예측을 수행합니다. AI의 예측 능력은 스트리밍 서비스의 사용자에게 '당신이 좋아할 만한 영상'을 추천하는 데도 사용되지만, 자연어 쿼리를 이해하고 정답을 예측할 수 있는 챗봇, 사진을 보고 얼굴 인식 기술을 사용해 사진 속 인물이 누구인지 제안하는 애플리케이션 등의 기반이 되기도 합니다. 그러나 AI가 이러한 예측 능력을 갖추기 위해서는 효과적인 AI 모델 훈련이 필요하고, AI를 활용하는 최신 애플리케이션에는 기존과는 약간 다른 훈련 방식이 필요할 수도 있습니다.
AI 모델의 근간이 되는 것은 일련의 알고리즘 모음, 그리고 해당 알고리즘들이 가장 정확한 예측을 수행하도록 훈련시키기 위한 데이터입니다. 단순한 모델은 하나의 알고리즘만 사용하기도 하므로 두 용어가 서로 겹칠 때도 있지만, 그런 모델 역시 데이터를 활용한 훈련을 거친 후의 결과물입니다.
수학적 의미에서 알고리즘은 정의되지 않은 계수가 있는 방정식으로 간주될 수 있습니다. 선택한 알고리즘이 데이터 세트를 분석해 가장 적합한 계수 값을 결정하면 AI 모델이 완성되고, 예측 모델이 구축됩니다. 'AI 모델 훈련'이라는 용어는 알고리즘에 데이터를 입력하고, 결과를 검토하고, 정확도 및 효율성을 높이기 위해 모델의 출력을 조정하는 일련의 과정을 의미합니다. AI 훈련을 위해서는 알고리즘에 입력되는 모든 종류의 데이터를 아우를 수 있는 방대한 데이터가 필요합니다.
알고리즘은 이상값, 돌발 변수, 불일치, 언뜻 보기에 이해가 되지 않는 패턴 등을 모두 처리해야 하고, 다시 한 번 강조하지만 입력되는 모든 데이터 세트를 처리해야만 합니다. 해당 과정은 패턴을 인식하고, 맥락을 이해하고, 적절한 결정을 내리는 능력을 쌓는 과정인 '학습'의 바탕이 됩니다. AI 모델 훈련을 충분히 진행하면 모델 내의 알고리즘 세트는 예측 가능성을 극대화하며 예상치 못한 상황에 대한 허용 오차를 구축하는, 주어진 상황에 대한 수학적 예측자를 나타냅니다.
핵심 요점
AI 모델 훈련은 입력물의 품질과 깊이, 그리고 결함을 식별하고 보완하는 트레이너의 역량에 따라 그 성공 여부가 결정되는 반복적인 프로세스입니다. 일반적으로는 데이터 과학자가 훈련 프로세스를 처리하지만, 일부 로코드/노코드 환경에서는 비즈니스 사용자도 훈련에 참여할 수 있습니다. 사실, 처리, 관찰, 피드백 제공, 개선으로 이루어진 사이클은 아이에게 새로운 기술을 가르치는 과정과 비슷합니다. AI 모델 훈련의 목표는 데이터의 다양한 변수, 이상값, 복잡성 사이에서 균형을 유지하며 정확한 출력물을 생성하는 수학적 모델을 만드는 것입니다. 생각해 보면 육아도 (물론 훨씬 더 복잡하지만) 그와 비슷한 여정입니다.
아이들이 새로운 기술을 배우는 방법을 생각해 보면 이해하기 쉬울 것입니다. 예를 들어, 아이에게 개와 고양이의 차이를 식별하는 방법을 가르치는 상황을 가정해 보겠습니다. 학습 과정은 기본적인 사진과 격려를 사용해 시작됩니다. 다음으로는 개와 고양이의 평균 크기, 개 짖는 소리와 야옹 소리, 행동 패턴과 같은 세부 정보들로 이루어진 더 많은 변수를 제시합니다. 아이가 이해하기 어려워하는 영역을 강조해 학습을 촉진할 수도 있습니다. 학습 과정이 끝나면 아이는 일반적인 가정 애완 동물부터 야생 동물 종에 이르는 모든 종류의 개와 고양이를 식별할 수 있어야 합니다.
AI 모델 훈련도 비슷합니다.
AI: 모델에 적합한 알고리즘 및 초기 학습 데이터 세트를 선택합니다.
아이: 기본적인 사진을 사용해 개와 고양이의 일반적인 차이점을 교육합니다.
AI: 출력 정확도를 평가하고 특정 부정확성들을 줄이거나 제거하기 위해 모델을 조정합니다.
아이: 답변에 따라 칭찬하거나 답변을 수정해 줍니다.
AI: 모델을 커스터마이징 및 미세 조정하기 위해 특정 대상에 대한 다양한 입력값이 포함된 추가 데이터 세트를 제공합니다.
아이: 학습 과정의 일환으로 다양한 특성, 모양, 크기를 강조합니다.
어린이와 마찬가지로, 초기 AI 모델 학습은 모델의 미래에 큰 영향을 미칠 수 있으며, 잘못된 영향을 바로잡기 위한 추가 학습이 필요한 경우도 있습니다. 이를 통해 초기 학습 및 모델 출시 후에도 지속적인 반복 학습을 위한 양질의 데이터 소스가 중요하다는 점을 잘 알 수 있습니다.
대부분의 기업은 데이터 분석 결과 생성, 데이터 이상값 강조 표시, 텍스트 인식 및 자연어 처리 등의 기능이 탑재된 애플리케이션을 활용해 이미 기존의 워크플로 및 프로세스 내에서 AI의 이점을 누리고 있습니다. 종이 영수증과 문서를 데이터 기록으로 변환하는 작업 등이 그 좋은 예입니다. 그러나 다른 한편으로는 많은 기업이 자사의 구체적이고 긴급한 필요를 해결하기 위한 AI 모델을 개발하고자 노력하고 있기도 합니다. 모델 개발 프로세스 그 자체는 프로세스 가속화와 같은 단기적인 가치부터 숨겨져 있던 인사이트의 발견, 새로운 제품 또는 서비스의 출시와 같은 장기적인 가치에 이르는 보다 깊은 차원의 이점들을 제공할 수 있습니다.
AI를 지원할 수 있는 인프라에 투자해야 하는 핵심적인 이유는 기업의 성장 방식에서 비롯됩니다. 간단히 말해서 기업은 무한에 가까운 데이터를 이용할 수 있습니다. 모든 방향에서 수많은 데이터가 유입되므로 내부 운영, 영업 및 마케팅 팀의 성과 등 기업의 거의 모든 부분으로부터 새로운 인사이트를 확보할 수 있습니다. 기업 운영의 이같은 특성을 감안하면, 적절한 훈련과 신중한 활용을 통해 AI는 거의 모든 상황에서 비즈니스 가치를 제공할 수 있다는 사실을 깨닫게 됩니다.
AI 훈련을 통해 얻을 수 있는 이점을 최대화하고자 하는 기업이 고려해 보아야 할 첫 번째 요소는 어떤 데이터를 입력할지, 그리고 확실한 의사 결정에 필요한 요소가 무엇인지 파악하는 것입니다. 제조 공급망을 예로 들어 보겠습니다. 적절하게 훈련된 AI 시스템에 모든 관련 데이터를 제공하면 배송비 계산, 배송 시간 및 품질/결함률 예측, 시장 상황에 기반한 가격 변경 제안 등 더 많은 작업을 수행할 수 있게 됩니다. 유입되는 데이터의 양이 많고 데이터 기반 의사 결정이 필요한 공급망은 AI를 활용한 문제 해결에 적합한 환경입니다. 반면 소프트 스킬이 여전히 최우선 과제인 경우에는 AI가 보조적인 정보를 제공할 수는 있지만, 혁신적인 변화를 가져오기는 어려울 것입니다. 연례 평가 기간에 관리자가 직원의 성과를 평가하는 작업이 그 좋은 예입니다. 이러한 경우 AI를 사용하면 관련 메트릭을 더 쉽게 수집할 수 있지만, 사람과 사람 간의 상호 작용에 기반한 평가를 대체할 수는 없습니다.
기업이 AI 관련 투자를 최대한 활용하기 위해 고려해야 할 사항은 다음과 같습니다.
이상의 매개변수를 설정함으로써 기업은 AI의 혜택을 가장 많이 받을 수 있는 비즈니스 영역을 파악하고, 실질적인 혜택을 누리기 위한 조치를 취할 수 있습니다.
모든 AI 훈련 프로젝트의 도전 과제 및 요구 사항은 서로 다르지만, AI 모델의 일반적인 훈련 프로세스는 동일합니다.
일반적인 AI 모델 훈련의 5가지 단계는 다음과 같습니다.
데이터 준비: 실제 상황을 정확하고 일관적으로 표현하는 양질의 데이터는 성공적인 AI 모델 학습의 근간입니다. 데이터의 품질이 부실하다면 AI의 출력물도 부실해질 수 밖에 없습니다. 프로젝트 팀은 성공적인 AI 훈련을 위해 올바른 데이터 소스를 큐레이션하고, 수동 및 자동 데이터 수집을 위한 프로세스와 인프라를 구축하고, 적절한 데이터 정제/변환 프로세스를 마련해야 합니다.
훈련 모델 선택: 데이터 큐레이팅이 훈련 프로젝트의 토대를 구축하는 작업이라면, 모델 선택은 메커니즘을 구축하는 작업입니다. 선택에 영향을 미치는 요소로는 프로젝트 매개변수 및 목표 정의하기, 아키텍처 선택하기, 모델 알고리즘 선택하기 등이 있습니다. 훈련 모델마다 필요한 리소스 양이 서로 다르므로, 해당 요소들 및 컴퓨팅 요구 사항, 마감일, 비용, 복잡성 등의 실질적인 요소들을 반드시 함께 고려해야 합니다.
초기 훈련 수행: 위의 예시에서 아이에게 고양이와 개를 구분하는 방법을 가르치는 것과 마찬가지로 AI 모델 훈련도 기본부터 시작합니다. 너무 광범위한 데이터 세트, 너무 복잡한 알고리즘, 잘못된 모델 유형 등을 사용하면 학습을 통해 발전하는 시스템이 아닌 단순히 데이터를 처리하는 시스템이 될 수도 있습니다. 초기 훈련 과정에서 데이터 과학자는 알고리즘을 망가뜨리는 실수가 발생하지 않도록 주의하며 예상되는 매개변수 내의 결과를 도출하는 데 집중해야 합니다. 무리하지 않는 훈련 방식을 통해 안정적이고 확실한 단계를 밟아가며 모델을 체계적으로 개선할 수 있습니다.
훈련 검증: 초기 훈련 단계를 통과한 모델은 주요 기준에 부합하는 예상 가능한 결과를 안정적으로 생성합니다. 다음 단계는 훈련 검증입니다. 이 단계에서 전문가들은 알고리즘의 문제, 의외성, 격차 등을 발견하기 위해 모델을 적절한 방식으로 시험합니다. 검증 단계에서는 초기 단계와 별도의 데이터 세트 그룹을 사용하고, 훈련용 데이터 세트에 비해 데이터의 폭과 복잡성이 증가하는것이 일반적입니다.
데이터 과학자는 이러한 데이터 세트로 패스를 실행하며 모델의 성능을 평가합니다. 출력물의 정확도도 중요하지만, 프로세스 자체도 그에 못지않게 중요합니다. 정확도(정확한 예측율), 리콜(올바른 클래스 식별율) 등의 변수는 프로세스의 최우선 순위입니다. 결과를 메트릭 값으로 판단할 수 있는 경우도 있습니다. 예를 들어, F1 점수(F1 score)는 분류 모델에 할당된 메트릭으로서, 다양한 유형의 긍정적/부정적 가중치를 통합해 모델의 성공 여부를 보다 총체적으로 해석하는 데 사용됩니다.
모델 테스트: 선별되고 목적에 부합하는 데이터 세트를 사용해 모델을 검증한 뒤에는 라이브 데이터를 사용해 모델의 성능과 정확성을 테스트할 수 있습니다. 테스트 단계에 사용하는 데이터 세트는 실제 시나리오로부터 가져와야 합니다. 이는 모델이 스스로 달릴 수 있도록 '보조 바퀴를 떼어내는' 단계입니다. 모델이 테스트 데이터로 정확한 결과물을, 나아가 더 중요한 요소인 예상 범위 내의 결과물을 도출한다면 실사용을 위한 준비가 완료된 것입니다. 모델이 어떤 식으로든 결함이 포함된 결과를 도출하면, 모델이 성능 기준을 충족하거나 초과할 때까지 훈련 과정을 반복합니다.
모델을 운영 환경에 구현하는 것은 중요한 이정표이지만, 구현이 완료되었다 해도 모델 훈련이 끝나는 것은 아닙니다. 모델의 특성에 따라서는 모든 데이터 세트의 처리 과정이 AI에게 또 다른 '학습'이 되어 알고리즘을 더욱 개선하고 정교화할 수 있는 경우도 있습니다. 특히 모델이 예상치 못한 이상값 데이터를 처리하는 경우 데이터 과학자는 모델의 성능과 결과물을 지속적으로 모니터링해야 합니다. 드문 경우긴 하지만 부정확한 결과물을 도출하는 모델은 그것이 향후의 결과물에도 영향을 미치지 않도록 방지하기 위한 추가 조정을 거쳐야 할 수도 있습니다.
AI 훈련은 복잡성, 결과 유형, 기능, 연산 능력 등의 변수에 따라 다양한 형태로 진행됩니다. 대출 승인 여부에 대해 예 또는 아니오로 이진법을 사용한 응답을 제공하는 방법도 있고, 추가 서류가 제공될 때까지 조건부로 '아니오'라는 응답을 제공하듯 보다 정성적인 결과가 필요한 상황에 대비해 더 많은 리소스를 사용하는 방법도 있습니다.
AI 모델 훈련에 사용하는 방법을 선택할 때는 목표 및 리소스를 모두 고려해야 합니다. 신중한 계획 없이 무리한 훈련을 추진하면 데이터 과학 팀이 훈련을 처음부터 다시 시작하고, 그만큼의 시간과 비용을 낭비하게 될 수도 있습니다.
규칙과 입력을 기반으로 의사 결정을 수행하는 AI 모델도 있지만, 심층 신경망은 다양한 데이터 관계를 기반으로 복잡한 의사 결정을 수행할 수 있는 기능을 제공합니다. 심층 신경망은 수많은 레이어로 이루어진 데이터 포인트 간의 패턴과 가중치 관계를 식별해 예측 결과를 제공하거나 정보에 기반한 평가를 수행합니다. 심층 신경망의 예로는 Apple의 Siri, Amazon의 Alexa와 같은 음성 인식 어시스턴트가 있습니다.
통계학에서 선형 회귀법은 입력과 출력 간의 관계를 결정하는 데 사용하는 방법입니다. 가장 간단한 형태로는 y = Ax + B와 같은 대수 공식을 예로 들 수 있습니다. 선형 회귀 모델은 데이터 세트를 사용해 입력, 출력, 가능한 변수 계수를 기반으로 그와 같은 공식을 작성합니다. 예측에 사용하는 최종 모델은 입력물과 출력물 간의 선형 관계를 가정합니다. 선형 회귀의 사용 사례로는 과거 판매 데이터에 기반한 판매 예측을 예로 들 수 있습니다.
통계 분야에서 가져온 회귀 분석은 이진법적인 상황에 효과적인 모델입니다. 회귀 분석은 확률 계산에 자주 사용되는 S-곡선 방정식인 로지스틱 함수에 기반한 방식입니다. AI 모델링의 경우, 회귀 분석은 확률을 결정하고 이진법적인 결과를 제공함으로써 예측을 수행하거나 신청자의 대출 승인 여부를 결정하는 등의 작업에 사용됩니다. 로지스틱 회귀의 사용 사례로는 사기 감지를 수행하는 금융 애플리케이션을 예로 들 수 있습니다.
의사 결정 트리(Decision Trees)는 AI와 무관한 분야에서도 자주 접할 수 있는 방법입니다. 의사 결정 트리의 작동 방식은 순서도의 노드와 유사합니다. 머신러닝 분야에서는 훈련 프로세스가 트리에 반복적으로 데이터를 공급해 노드를 추가할 시기 및 다른 노드 경로를 보낼 위치를 식별합니다. 의사 결정 트리의 사용 사례로는 금융 대출 승인을 예로 들 수 있습니다.
의사 결정 트리의 깊이를 너무 깊게 설정하면 학습용 데이터 세트에 대한 적합도가 과도해질 수 있습니다. 랜덤 포레스트 기법은 의사 결정 트리의 집단, 즉 '포레스트'를 결합해 가장 큰 합의 또는 가중 평균을 찾아 결과를 도출함으로써 의사 결정 트리의 문제를 보완해 주는 방법입니다. 랜덤 포레스트의 사용 사례로는 고객 프로필의 여러 요소에 대한 다양한 의사 결정 트리를 기반으로 고객 행동을 예측하는 작업을 예로 들 수 있습니다.
아동의 교육을 예로 들어 보면, 지도 학습은 자녀가 체계적인 수업을 받으며 정해진 커리큘럼을 따르도록 만드는 방식과 같습니다. AI 모델링의 경우 지도 학습은 확립된 훈련 데이터 세트 및 정의된 매개변수를 사용해 모델을 훈련시키는 것을 의미하며, 데이터 과학자는 훈련 데이터 세트를 큐레이팅하고, 테스트 데이터 세트를 실행하고, 모델 피드백을 제공하는 교사 역할을 수행합니다. 지도 학습의 사용 사례로는 AI를 사용해 폐 X선 사진으로부터 비정상적인 세포를 찾아내는 작업을 예로 들 수 있습니다. 훈련 데이터 세트는 이상이 있는 엑스레이 및 없는 엑스레이이며, 훈련 과정에서 모델에 각 데이터 세트의 특징을 사람이 직접 알려줍니다.
계속해서 아동 교육을 예로 들어 보면, 비지도 학습은 아이들에게 다양한 가능성을 제시하고 본인의 호기심에 따라 스스로 학습할 수 있는 자유를 주는 몬테소리 철학과 유사합니다. AI 모델링의 경우 비지도 학습은 AI에게 매개변수나 목표를 설정하지 않고 레이블이 지정되지 않은 데이터 세트를 수집하도록 지시하는 방식을 의미하며, 데이터로부터 패턴을 파악하는 것은 전적으로 AI의 몫입니다. 비지도 학습의 사용 사례로는 고객 행동의 상관관계를 파악하기 위해 분기별 판매 데이터를 AI 모델에 입력하는 리테일 업체를 예로 들 수 있습니다.
아이에게 간식을 줌으로써 특정한 행동을 하거나 하지 않도록 유도해 본 적이 있다면 이미 직접 강화 학습을 실행해 본 것입니다. AI의 강화 학습은 긍정적 또는 부정적 강화로 이어지는 실험적인 결정들로부터 시작됩니다. 시간이 경과하면 AI는 상황을 처리하고 긍정적인 강화를 극대화하기 위한 가장 정확하거나 성공적인 결정, 즉 최선의 결정이 무엇인지 학습합니다. 강화 학습의 사용 사례로는 YouTube에서 사용자의 시청 기록을 기반으로 제시하는 '추천 동영상' 목록을 예로 들 수 있습니다.
훈련된 상황 외의 다른 상황에도 성공적으로 적용 가능한 AI 모델도 있습니다. 전이 학습이란 기존의 AI 모델을 신규 모델의 출발점으로 사용하는 방법입니다. 이같은 용도 변경은 기존 모델이 일반적인 시나리오를 처리하는 모델일 때 가장 효과적입니다. 구체적인 시나리오를 처리하던 모델은 재학습이 어려울 수 있습니다. 전이 학습의 사용 사례로는 기존 이미지 분류 모델의 파라미터를 기반으로 특정 유형의 이미지를 분류하는 새로운 AI 모델을 훈련하는 작업을 예로 들 수 있습니다.
지도 학습과 비지도 학습의 원리를 모두 사용하는 준지도 학습은 라벨이 지정된 소규모 데이터 세트를 사용한 모델 훈련부터 시작됩니다. 이후 모델은 레이블이 지정되지 않은 데이터 세트, 큐레이션되지 않은 데이터 세트를 사용해 패턴을 세분화하고 사전에 예측할 수 없었던 인사이트를 생성합니다. 일반적으로 반지도 학습의 처음 몇 단계 동안은 보조 바퀴가 달린 자전거와도 같이 레이블이 지정된 데이터 세트만 사용합니다. 그 이후로는 주로 레이블이 지정되지 않은 데이터를 사용하게 됩니다. 반지도 학습의 사용 사례로는 텍스트 분류 모델에 대량의 비지도 텍스트 문서를 입력하기에 앞서 큐레이션된 세트를 사용해 기본 파라미터를 설정하는 작업을 예로 들 수 있습니다.
생성형 모델은 매우 큰 예제 데이터 세트를 사용해 프롬프트에 기반한 출력물을 생성하는 비지도 AI 학습 방법입니다. 생성형 모델의 예시로는 이미지 아카이브의 메타데이터에 기반한 AI 생성 이미지, 입력된 문장의 데이터베이스에 기반한 예측 텍스트 등이 있습니다. 생성형 모델은 단순히 데이터를 분류해 출력하는 것에 그치는 것이 아니라, 수천, 수백만 개의 예제 데이터를 학습해 독자적인 출력물을 생성할 수 있습니다. 생성형 모델의 사용 사례로는 ChatGPT와 같은 챗봇을 예로 들 수 있습니다.
AI 모델을 제대로 훈련시키려면 데이터, 그것도 아주 많은 양의 데이터가 필요합니다. 데이터는 AI 모델 훈련의 가장 중요한 요소입니다. 데이터가 없으면 모델은 학습할 수 없습니다. 양질의 데이터가 없으면 모델은 잘못된 것들을 학습하게 됩니다. 따라서 데이터 과학자는 훈련 프로젝트에 사용할 데이터 집합을 분명한 의도를 바탕으로 신중하게 선택합니다.
최적의 AI 모델 훈련을 위한 데이터 세트 큐레이션을 위해서는 다음과 같은 요소를 반드시 고려해야 합니다.
AI 모델 훈련에는 고유한 도전 과제가 뒤따릅니다. 개중 일부는 물류와 관련된 도전 과제입니다. 즉, 인프라, 컴퓨팅 성능을 비롯해 훈련을 처음부터 끝까지 진행하기 위한 실질적인 고려 사항입니다. 또한 결과물의 편향을 완화하고 시스템의 객관성을 유지하는 방법을 파악하는 것과 같이 데이터 과학자의 개입이 필요한 다른 도전 과제들도 있습니다.
모든 AI 모델 훈련 이니셔티브에 수반되는 도전 과제는 다음과 같습니다.
데이터 편향: AI 모델이 정확한 결과물을 도출하기 위해서는 양질의 데이터를 활용한 훈련을 거쳐야 합니다. 데이터 편향을 완화하기 위해 데이터 과학자는 훈련 데이터 세트를 큐레이팅하기에 앞서 데이터 소스를 반드시 철저히 조사해야 합니다.
적합한 데이터: 훈련 데이터 세트는 적절한 다양성 및 세분성을 지니는 대량의 데이터로 구성되어야 합니다. 따라서 프로젝트 팀은 양질의 데이터를 대량으로 큐레이션해야 할 뿐만 아니라, 여러 실질적 문제를 함께 고려해야 합니다. 데이터 세트가 커질수록 저장, 정제/변환, 처리, 일반적인 품질 관리 등이 모두 어려워지기 때문입니다.
컴퓨팅 성능 및 인프라 요구 사항: AI 모델이 복잡해질수록 더 많은 컴퓨팅 성능 및 인프라 지원이 필요합니다. 모델 훈련 방법을 선택할 때는 훈련에서 실제 활용에 이르는 전 과정에 걸쳐 그 실용성을 고려해 보아야 합니다. 조달 가능한 것보다 많은 리소스가 필요한 모델 유형을 선택하는 경우 전체 프로젝트가 무산될 수도 있습니다.
과적합: AI 모델이 훈련 데이터 세트에 지나치게 맞춰지면 해당 데이터 세트에 고정되고 다양성 및 돌발 상황을 처리할 수 있는 능력을 갖추지 못하게 될 수 있습니다. 이러한 현상을 '과적합(overfitting)'이라고 부릅니다. 과적합은 모델의 정확한 미래 예측을 방해합니다. 과적합의 예시로는 훈련 데이터 세트에 기반한 예측 정확도는 99%임에도 실제 데이터 세트를 사용했을 경우의 정확도는 75%~85%에 불과한 모델을 들 수 있습니다. AI의 인지된 정확도(perceived accuracy)는 AI 시스템이 현재 기능을 기반으로 얼마나 정확히 작동하는 것처럼 보이는지를 나타내는 척도임을 유념해야 합니다. 즉, 사용자나 이해관계자가 관찰하거나 경험한 정확도입니다. 반면 AI의 잠재적 정확도(potential accuracy)는 시스템이 최적의 리소스를 갖춘 이상적인 조건에서 달성할 수 있는 최대 정확도를 의미합니다. 인지된 정확도와 잠재적 정확도의 차이를 이해하는 것은 AI 시스템의 성능을 평가하고 개선하거나 향후 개발할 영역을 파악함에 있어 중요한 요소입니다.
'과적합'과 '과훈련'이라는 용어는 종종 동일한 의미로 사용되지만 분명한 차이가 있습니다. 앞서 설명한 바와 같이 과적합은 AI가 훈련 데이터를 사용할 때는 매우 우수한 성능을 보이지만 새로운 데이터를 사용한 일반화 능력은 갖추지 못하는 경우를 말합니다. 반면 과훈련은 모델이 과도한 훈련 끝에 훈련 데이터 및 새로운 데이터 모두로부터 저품질의 결과물만을 도출하게 되는 경우를 의미합니다. 모델이 너무 오랫동안, 또는 너무 복잡한 훈련을 거치며 일반화 능력을 갖추지 못하게 되는 경우 발생합니다. 양쪽 모두 모델 훈련 과정에서 지양해야 할 결과입니다.
설명 가능성: AI 모델링과 관련해 특히 문제가 되고 있는 것은 모델의 의사 결정 방식에 대한 설명 가능성이 부족하다는 것입니다. 사용자는 결과물을 바탕으로 추론할 수 있지만, 모델의 사고 과정은 여전히 모호할 수 있습니다. 일부 개발자들은 이러한 격차를 해소하기 위해 보다 투명한 설명 가능성을 갖춘 모델을 비롯한 다양한 도구를 개발했습니다. 그러나 해당 도구들을 입력물 및 출력물에 구현하는 방법, 사용성, 세부 사항, 접근성 등은 모두 서로 다릅니다.
AI는 컴퓨팅의 역사 속에서 언제나 다양한 형태로 존재해 왔지만, 지난 20년 동안 알고리즘, CPU 성능, 그래픽 처리 장치(GPU) 성능, 클라우드 기반 리소스 공유 기술 등이 급속히 발전함에 따라 AI의 발전도 가속화되었습니다. AI는 이미 수많은 애플리케이션에 내장되어 있으며 많은 사용자들이 그 존재를 인지하지 못한 채 사용하고 있습니다. 사용자가 음악을 스트리밍하면 AI가 좋아하는 노래와 아티스트를 분석해 맞춤형 재생 목록을 제공합니다. 사용자가 문자 메시지를 입력하면 AI가 자주 사용하는 단어를 분석해 다음에 입력할 내용을 제안합니다. AI를 사용한 자동화된 추천 기능으로 마음에 드는 TV 프로그램을 발견하는 경우도 있습니다.
AI의 현재는 이런 모습입니다. 그 미래는 과연 어떤 모습일까요?
AI의 잠재력은 모델 훈련 방법의 발전과 비례합니다. 미래의 AI 모델 훈련 가능성을 함께 살펴보겠습니다.
AI의 혁신이 기하급수적으로 가속화되어온 것처럼 느껴지는 데는 그럴만한 이유가 있습니다. 지난 10년간 데이터의 볼륨과 연결성이 폭발적으로 증가함에 따라 AI 시스템 훈련이 훨씬 쉬워졌고, 복잡한 모델을 구현할 수 있게 되었고, 새롭고 개선된 알고리즘도 속속들이 등장하고 있기 때문입니다. 이같은 상황적 발전에 힘입어, AI는 향후 10년 내로 상황의 이면에 있는 이유와 방법을 이해하는 능력을 키우는 심층 추론, 더 작은 데이터 세트만을 사용하는 훈련 효율성 향상, 비지도 학습을 통한 더욱 효율적이고 정확한 모델 구축 등의 여러 원대한 목표를 달성할 수 있게 될 것으로 보입니다.
사람의 경우, 전수 가능한 기술은 다른 사람이 새로운 작업을 훨씬 쉽게 시작할 수 있도록 도움으로써 전반적인 고용 가능성과 생산성을 높여줍니다. AI 전이 학습의 이점도 동일합니다. 그러나 효과적인 전이 학습을 위해서는 여전히 많은 도전 과제를 해결해야 합니다. 현 시점에서 전이 학습은 원래 모델과 매우 유사한 영역에서 가장 잘 작동하므로 그 사용처가 제한적입니다. 전이 학습의 기능 확장을 위한 복잡한 재훈련에는 훨씬 많은 컴퓨팅 성능과 리소스가 필요합니다. 효율성 및 처리 방식을 혁신할 수 없다면 모델을 처음부터 새로 구축하는 단순한 방법이 더 나을 수도 있습니다.
어쩌면 AI의 가장 강력한 능력은 인간보다 빠르고 정확한 작업 수행을 통해 배송 직원, 회계사 등을 반복 작업으로 인한 부담으로부터 해방시켜주는 능력일 수도 있습니다. 물론 AI가 그러한 수준까지 도달하기 위해서는 데이터 세트를 큐레이팅하고, 결과를 관찰하고, 모델을 조정하기 위한 시간과 노력이 필요합니다.
다양한 AI 모델 훈련 도구를 사용해 개발 및 훈련 프로세스를 가속화할 수 있습니다. 해당하는 도구로는 사전 구축된 모델 라이브러리, 오픈 소스 프레임워크, 코딩 및 환경 보조 도구, 그라디언트 부스팅 등이 있습니다. 사용하는 모델 유형에 따라 달라지는 도구도 있고, 컴퓨팅 리소스에 대한 특정 표준을 요구하는 도구도 있습니다.
프로젝트에 가장 적합한 도구를 결정하기 위해서는 팀 내부적으로 다음과 같은 질문을 던져 보는 것이 좋습니다.
이상의 질문에 답하는 과정에서 AI 모델 훈련 프로세스에 도움이 될 만한 효과적인 도구들의 목록을 작성할 수 있습니다.
복잡한 AI 모델 훈련은 수백, 나아가 수천 개의 독립적인 서비스가 서로 정보를 조율하고 공유하는 리소스 집약적 이니셔티브가 될 수도 있습니다. Oracle Cloud Infrastructure(OCI)는 고성능 이더넷 네트워크를 통해 연결된 GPU를 제공함으로써 고객의 시간과 비용을 절약하고, 가용성과 안정성을 극대화합니다. OCI 고객은 간단하고 빠른 상호 연결망을 통해 매우 복잡한 모델도 대규모로 훈련하고 배포할 수 있습니다.
AI 분야의 선구자와도 같은 머신러닝 모델들은 고성능 계산에 기반한 수많은 규칙과 확률을 기반으로 구축되었습니다. 세계적인 체스 토너먼트에서 인간과 경쟁했던 슈퍼컴퓨터 Deep Blue를 구축하는 과정에서도 그러한 방식을 사용했습니다. 그러나 이제 AI 모델은 외부 데이터에 기반한 규칙을 사용하는 것에서 한 걸음 더 나아가, 대량의 데이터 세트를 사용해 훈련하고 내부적으로 인사이트를 생성하는 작업에 중점을 두는 방향으로 진화했습니다. 여전히 규칙 기반 의사결정 트리를 사용하는 AI 모델도 있지만, 신경망을 통한 복잡한 프로세스와 예측을 지원하는 모델도 있습니다.
AI는 매우 흥미로운 방향으로 발전해 가고 있지만 AI의 미래를 좌우하는 것은 결국 고품질의 훈련입니다.
모델 훈련을 수행하는 기업은 관련 데이터 세트 및 제도적 지식을 잘 문서화해 두어야 합니다. 훈련 지원 외에도 수많은 이점을 제공하는 AI 전문가 조직(CoE)을 구성하면 문서화 작업에도 많은 도움을 받을 수 있습니다.
AI 모델 훈련이란 무엇인가요?
AI 모델 훈련은 AI 모델에 엄선된 데이터 세트를 제공하여 출력물의 정확성을 향상시키는 프로세스입니다. AI 모델의 복잡성, 학습 데이터 세트의 품질, 학습 데이터의 양에 따라 많은 시간이 걸릴 수도 있습니다. 훈련 프로세스가 사전에 설정한 성공 기준 벤치마크를 통과한 뒤에도 데이터 과학자는 결과물을 계속해서 모니터링합니다. 정확도가 하락하거나 모델이 특정한 유형의 상황을 처리하는 데 어려움을 겪는 경우 추가 훈련이 필요할 수도 있습니다.
AI 모델은 어디서 훈련할 수 있나요?
적절한 도구를 사용 가능하고, 필요한 데이터에 액세스할 수 있는 사람이라면 누구든지 모든 PC를 사용해 AI 모델을 훈련할 수 있습니다. 훈련 단계로는 문제 파악하기, 훈련 모델 선택하기, 훈련용 데이터 세트 찾기, 훈련 프로세스 실행하기 등이 있습니다. 훈련은 프로젝트의 범위와 사용 가능한 리소스에 따라 소규모 로컬 규모로도, 대규모 엔터프라이즈 규모로도 진행 가능합니다. 신인 개발자 또는 독립 개발자는 다양한 프로그래밍 언어에 대응하는 CPU 리소스를 보유한 클라우드 서비스를 활용해 지리적 제약에서 벗어날 수 있습니다.
AI 모델 훈련에 드는 비용은 어느 정도인가요?
AI 모델 훈련 비용은 프로젝트의 범위에 따라 달라집니다. 업계 전반적으로는 CPU/GPU 성능이 향상되고 클라우드 액세스를 통해 더 많은 리소스를 사용할 수 있게 되면서 훈련 비용은 지속적으로 하락하는 추세입니다. 실제로 Stanford’s Institute for Human-Centered Artificial Intelligence AI Index에 따르면 이미지 분류와 같은 소규모 프로젝트의 평균 훈련 비용은 2017년에는 1,000달러였지만 2022년에는 5달러에 불과했습니다.
반면 대규모 엔터프라이즈 AI 프로젝트의 비용은 증가하고 있습니다. 예를 들어 ChatGPT 훈련과 같은 프로젝트를 수행하기 위해서는 약 3백만~5백만 달러의 예산이 필요할 수 있습니다. 이같은 격차가 발생하는 이유는 프로젝트의 복잡성이 서로 다르고, 가용 리소스가 증가함에 따라 대량의 리소스를 확보할 수 있는 프로젝트 팀은 극도로 복잡하고 기존의 한계를 뛰어넘는 프로젝트를 수행할 수 있게 되었기 때문입니다.
AI 모델링 방법은 어떻게 배울 수 있나요?
AI 모델의 훈련 방법을 익히기 위해서는 공식 교육 또는 실무 훈련을 받아야 합니다. 전문 지식을 갖춘 뒤에는 다음과 같은 4가지 단계를 거쳐 AI 모델을 구축할 수 있습니다.
AI 모델 훈련의 4가지 유형이란 무엇인가요?
일반적으로 구분되는 AI 모델 훈련의 4가지 유형은 다음과 같습니다.
일부 데이터 과학자들은 기존의 AI 모델이 새로운 모델 AI 개발의 출발점이 되는 전이 학습, 지도 학습과 비지도 학습이 혼합된 준지도 학습 등의 방식을 사용하기도 합니다.