Joseph Tsidulko | Senior Writer | 2025년 7월 29일
대규모 언어 모델(LLM)은 주로 텍스트나 음성, 기타 방법으로 제공되는 사용자 입력에 대해 인간이 하는 것과 비슷한 응답을 생성하도록 설계된 인공지능으로, 점점 더 널리 사용되고 있습니다. LLM은 대량의 텍스트를 학습하고, 프롬프트로 제공된 맥락에 따라 다음에 올 단어나 문장을 예측하는 방법을 학습하며, 나아가 특정 작가나 장르의 글쓰기 스타일을 모방할 수도 있습니다.
LLM은 2020년대 초반에 연구실을 벗어나 대중에게 알려졌습니다. 그 이후로 요청을 해석하고 관련 응답을 생성하는 놀라운 기능 덕분에 독립형 제품 및 다양한 유형의 비즈니스 소프트웨어에 내장된 부가적인 기능으로 발전하며 자연어 처리, 기계 번역, 콘텐츠 생성, 챗봇, 문서 요약 등을 제공했습니다.
이 기술은 대규모 데이터 세트를 통합하고 모델 성능 향상을 위한 학습 및 튜닝 단계를 추가하며 계속해서 빠르게 진화하고 있습니다. 더욱 강력해진 컴퓨팅 인프라를 통해 좀 더 폭넓고 심층적인 훈련이 가능하게 되었고, 덕분에 기업의 목표 달성 계획을 수립하는 데 활용할 수 있는 추론 기능이 점점 더 정교해지고 있습니다. 이러한 추론 기능은 AI 에이전트의 기능을 강화하기도 합니다. AI 에이전트에 고급 LLM이 적용되면 인간 운영자가 설정해 둔 작업을 에이전트가 완료할 수 있습니다.
대규모 언어 모델은 책, 웹 및 기타 출처에서 가져온 수십억 개의 단어로 구성된 방대한 데이터 세트를 학습한 뒤 쿼리에 대해 인간과 비슷하고 맥락에 맞는 응답을 생성할 수 있는 인공지능 시스템입니다. LLM은 질문(LLM 관련 용어로는 '프롬프트')을 이해하고 자연어 응답을 생성하도록 설계되었으므로 고객 질문에 대한 답변, 보고서 정보 요약, 언어 번역, 시 작성, 컴퓨터 코드 작성, 이메일 초안 작성 등의 작업을 수행할 수 있습니다. 일반적으로 LLM은 학습한 언어의 문법과 의미를 깊이 이해하고 있습니다. 기업의 자체 데이터를 사용하여 맞춤형 응답을 제공하도록 LLM을 구성할 수도 있습니다.
LLM은 이렇게 놀라운 능력을 가지고 있지만, 사용자는 그 한계점도 잘 알고 있어야 합니다. 오래된 데이터와 불량한 프롬프트가 제공되면 챗봇이 기업의 제품에 대해 잘못된 답변을 제공하는 등의 실수를 초래할 수 있습니다. 데이터가 충분하지 않으면 LLM이 잘못된 답변을 지어낼 수도 있습니다(환각 현상). 그리고 LLM은 예측은 잘하지만 그러한 결론을 도출한 이유는 잘 설명하지 못합니다. 최근의 LLM에서는 이러한 부분을 개선하고자 노력하고 있습니다.
그럼에도 불구하고 LLM은 자연어 처리 분야에서 상당한 진전을 이루었습니다. 비즈니스 활용도가 무궁무진해서 새로운 애플리케이션이 빠르게 개발되고 도입되고 있습니다.
핵심 요점
자연어 처리는 1960년대부터 인공지능 분야에서 적극적으로 연구하던 분야였으며, 초기 언어 모델은 수십 년 전에 등장했습니다. 모델을 더 정교하게 만들기 위한 다층 신경망 구조의 머신러닝 기법인 딥 러닝이 도입된 대규모 언어 모델의 탄생 덕분에 이 분야는 추진력을 얻게 되었습니다. LLM의 또 다른 특징은 파운데이션 모델의 학습이 데이터에 레이블을 지정하는 인간의 개입 없이 이루어진다는 점입니다. 이를 자기 지도 학습이라고 합니다.
LLM의 현대적 개념은 2017년에 혜성처럼 등장한 Google의 논문을 통해 탄생했습니다. 이 논문에서는 트랜스포머 네트워크라는 강력하고 새로운 아키텍처에 대해 기술합니다. 트랜스포머에는 병렬로 처리할 수 있는 셀프 어텐션 메커니즘이 적용되었는데 이를 통해 모델 학습 및 배포를 가속화하고 비용을 절감할 수 있습니다. OpenAI는 이 아키텍처를 적용하여 최초의 현대적 LLM으로 인정받는 GPT-1을 개발했습니다.
기업들은 LLM을 수많은 사용 사례에 적용할 수 있으며, LLM이 기업의 생산성과 효율성, 고객 응대를 개선할 엄청난 잠재력을 지녔다는 사실을 빠르게 깨달아가고 있습니다.
LLM은 머신러닝 프로세스를 통해 개발된 다양한 유형의 AI 중 하나입니다. 그러나 이러한 모델을 정의하고 구별하는 몇 가지 요소가 있습니다. 가장 중요한 것은 규모입니다. 대규모 언어 모델(LLM)에서 뜻하는 '대규모'는 최종 출력을 계산하는 매개변수의 수와 해당 매개변수를 조정하여 모델 학습에 사용되는 데이터의 양을 나타냅니다.
LLM은 다양한 최첨단 응용 분야에서 원동력이 되어 줍니다. OpenAI의 브라우저 기반 GPT-3.5 모델인 ChatGPT, GPT-4o 및 GPT-4 등의 최신 버전이 출시되며, 대중들도 입을 다물기 어려울 정도로 놀라운 LLM의 능력을 알게 되었습니다. 그러나 LLM의 이점은 이에 그치지 않고 금융 서비스, HR, 소매, 마케팅 및 판매, 소프트웨어 개발, 고객 지원, 의료 등 다양한 산업 및 사업 부문으로 뻗어나가고 있습니다.
LLM의 인기 비즈니스 응용 분야로는 고객 서비스 챗봇, 고객 감정 분석, 맥락에 맞는 자연스러운 구어체 번역 서비스 등이 있습니다. 또한 LLM은 제약 연구 과정에서 단백질 구조를 예측하고, 소프트웨어 코드를 작성하고, 기업들이 비즈니스 프로세스를 자동화하기 위해 점점 더 많이 배포 중인 에이전트를 구동하는 등 보이지 않는 곳에서 더욱 전문적인 작업을 수행하고 있습니다.
LLM은 점점 더 다양한 비즈니스 사용 사례에 적용되고 있습니다. 일례로 현재 많은 기업들은 고객 서비스 전략의 일환으로 챗봇을 사용하고 있습니다. 그러나 이러한 모델의 다기능성이라는 장점을 눈여겨본 창의적인 엔터프라이즈 소프트웨어 개발자들은 이 기반 기술을 단순히 언어 응답을 생성하는 것 이상의 다양한 작업을 처리하고 있습니다.
1. 고객 지원 자동화
엔터프라이즈 환경에서 가장 돋보이는 LLM 응용 분야는 고객 지원, 특히 고객 응대입니다. 언어 모델을 기반으로 하는 대화형 사용자 인터페이스 또는 챗봇은 문의를 언제든지 거의 무제한으로 처리할 수 있습니다. 이를 통해 고객 불만의 주요 원인이기도 한, 업무 과중으로 인한 콜 센터 직원의 응답 시간 지연을 획기적으로 개선할 수 있습니다.
챗봇을 다른 LLM 기반 애플리케이션과 통합하면 기기 부품 교체, 문서, 설문 조사 전송과 같은 상담 전화 후의 후속 조치를 자동화할 수 있습니다. 또한 LLM은 시의적절한 정보, 감정 분석, 번역 및 상호 작용 요약을 제공함으로써 사람 담당자를 직접적으로 지원할 수 있습니다.
50개국 이상에서 80가지 언어로 운영되는 한 자산운용사는 이러한 기능을 활용하여 고객이 자신의 요구에 제일 잘 맞는 금융 상품을 쉽게 찾고 선택할 수 있도록 지원합니다. 은퇴 계좌를 전문적으로 관리하는 이 회사는 맞춤형 챗봇으로 고객 지원을 현대화함으로써 서비스 수준이 150% 증가하고 운영 비용이 30% 절감되는 효과를 누렸습니다. 고객들은 이제 이 회사의 웹 페이지를 방문하여 다양한 언어로 언제든지 챗봇에게 계좌 관련 질문을 할 수 있습니다.
2. 콘텐츠 생성 및 요약
LLM은 원본 콘텐츠를 생성하거나 기존 콘텐츠를 요약할 수 있습니다. 이 두 사용 사례 모두 모든 규모의 기업에 매우 유용한데, 보고서, 생성형 AI를 사용하여 이메일, 블로그, 마케팅 자료 및 소셜 미디어 게시물을 작성할 수도 있고, 생성된 콘텐츠를 LLM으로 특정 집단이나 개별 고객에게 맞춤화할 수도 있습니다.
요약은 방대한 양의 정보를 인간이 신속하게 검토하고 이해할 수 있는 형태로 해당 분야의 특성을 고려하여 축약하는 기능입니다. LLM은 텍스트 내 다양한 아이디어의 중요성을 평가한 다음, 주요 부분을 추출하거나 원본 텍스트에서 관련성이 가장 높고 중요한 정보라고 판단되는 내용을 개괄하는 방식으로 요약을 수행합니다.
간혹 LLM의 '요약 능력은 평균 정도'라는 비판도 있습니다. 이는 요약 내용이 지나치게 일반적이며, 원본 자료에 있는 주요 세부 사항이나 중요한 점을 누락하는 경우가 있다는 의미입니다. 또한 요약의 신뢰성을 측정하고 그에 따라 다양한 모델의 성능을 평가하는 것도 까다롭습니다. 그럼에도 불구하고 기업들은 이러한 역량을 적극적으로 도입하고 있습니다.
한 유수 클라우드 통신사는 LLM을 배포하여 매일 20가지에 달하는 언어로 올라오는 수백 개의 고객 지원 티켓과 채팅 기록을 자동으로 요약합니다. 이러한 요약 자료는 고객 지원 엔지니어가 고객의 문제를 더 신속히 해결하고 전반적인 경험을 개선하는 데 도움이 됩니다.
3. 언어 번역
Google이 트랜스포머를 개발할 당시의 초기 의도는 기계가 다양한 언어 쌍을 더 잘 번역하게 만드는 것이었으며, 이후에야 이 모델이 더 다양한 기능을 제공하며 개발자들에게 각광받게 되었습니다. 이 아키텍처를 처음 구현한 개발자들은 그 목표를 달성했고, 기존 모델에 비해 시간과 컴퓨팅 리소스가 훨씬 적게 드는 모델을 사용하여 영어-독일어 번역쌍에서 독보적인 성능을 제공할 수 있었습니다.
이 사용 사례가 한정적으로 보일 만큼, 현대 LLM의 사용 사례는 그보다 더 뛰어납니다. 대부분의 LLM은 특별히 번역기로 훈련되지는 않지만, 두 언어 모두에서 광범위한 데이터 세트로 학습한 경우 한 언어로 된 텍스트를 해석하여 다른 언어로 정확히 재작성하는 능력이 탁월합니다. 언어의 장벽을 무너뜨리는 이러한 변혁은 여러 국가에 걸쳐 운영되는 기업들에 매우 큰 의미가 있습니다. 다국적 기업은 고급 언어 서비스를 사용하여 제품 및 서비스에 대한 다국어 지원을 개발하고, 가이드와 자습서, 마케팅 자료를 번역하고, 새로운 국가로 진출할 때 기존 교육 자료를 사용하여 근로자를 교육합니다.
멀티모달 모델의 발전
LLM을 AI용 파운데이션 모델로 사용하여 언어 이외의 형태(모달리티)로 출력을 생성하는 연구가 활발히 진행되고 있습니다. LLM의 놀라운 다기능성 덕분에, 레이블 지정된 데이터를 사용한 미세 조정 프로세스를 거치면 오디오와 이미지뿐만 아니라 동영상까지도 해석하고 생성할 수 있습니다. 프롬프트를 수신하거나 언어 이외의 영태로 출력을 생성하는 이러한 모델을 대규모 멀티모달 모델(LMM)이라고도 합니다.
환경 고려 사항
LLM은 대규모로 개발 및 운영되는 경우가 일반적이므로 막대한 컴퓨팅 성능이 필요합니다. 몇 주에 걸쳐 수백에서 수천 개에 이르는 GPU 클러스터로 단일 모델을 훈련하면 엄청난 양의 에너지가 소비될 수 있습니다. 그리고 모델을 성공적으로 배포한 뒤에도, 추론을 실행하는 인프라는 실제 운영 환경에서 끊임없는 사용자 쿼리를 처리하느라 상당한 전력을 소모합니다.
GPT-4를 훈련하는 데에는 약 50기가와트시(GWh)의 에너지가 들었습니다. 비교해 보자면, 50기가와트시의 에너지는 이론적으로 미국의 평균적인 가정 4,500~5,000곳에 전력을 공급할 수 있는 양입니다. 현재 ChatGPT는 수백만 건의 쿼리에 응답하기 위해 매일 수백 메가와트시(MWh)를 소비하는 것으로 추정됩니다. 언어 모델이 거대해지는 만큼 에너지 소비와 지속 가능성에 대한 우려도 커질 수 있습니다. 이러한 이유로 인공지능 기업들은 탄소 발자국을 줄이기 위해 대체 에너지원을 모색하는 데 앞장서고 있습니다.
Oracle은 기업이 LLM이라는 이 혁신적인 기술의 세부 사항이나 전력 수요를 두고 고심하지 않아도 그 강력한 기능을 활용할 수 있도록 힘을 실어줍니다. Oracle Cloud Infrastructure(OCI) Generative AI는 인프라를 복잡하게 관리할 필요 없이 비용 효율적인 방식으로 고효율의 맞춤형 최신 LLM을 간단히 배포할 수 있는 완전 관리형 서비스입니다. 기업은 여러 파운데이션 모델 중에서 원하는 모델을 선택한 다음, 자체 데이터를 사용하여 전용 GPU 클러스터에서 모델을 미세 조정하여 비즈니스 요구에 가장 적합한 맞춤형 모델을 구축할 수 있습니다.
기반 기술을 더 심도 있게 활용하고자 하는 기업은 Machine Learning in Oracle AI Database로 전환하고 있습니다. 이 플랫폼은 머신러닝 수명 주기의 주요 요소를 단순화하고 자동화하여, 데이터 과학자가 Oracle 데이터베이스에서 민감한 데이터를 마이그레이션하지 않고도 모델을 신속하게 구축할 수 있도록 지원합니다. 주요 기능으로는 인기 머신러닝 프레임워크, API, 자동화된 머신러닝(AutoML), 노코드 인터페이스 등이 있으며 애플리케이션에서 사용할 모델을 생성할 때 활용할 수 있는 고성능의 데이터베이스 내 알고리즘도 30가지 이상 제공됩니다.
또한 많은 유수 기업이 Oracle AI 인프라를 활용하여 자체 LLM을 구축하고 있습니다. AI 인프라는 OCI Generative AI와 같이 더 높은 수준의 AI 서비스의 기반이 됩니다. 또한 가속화된 컴퓨팅, 네트워킹, 스토리지 덕분에 요구사항이 매우 까다로운 LLM에도 사용할 수 있습니다.
LLM은 기업의 운영 방식과 고객 참여 방식을 혁신할 상당한 잠재력을 지니고 있으므로, 이 기술에 새로 혁신하고 투자한다면 글로벌 시장을 움직이고 사뭇 다른 기업 전략을 사용하게 될 수 있습니다. 그러나 비즈니스 및 IT 리더들은 과장된 인기 너머의 실체를 냉정히 파악할 줄도 알아야 합니다. 즉, 이 기술을 통해 얻을 수 있는 다양한 실질적인 이점도 파악하도록 노력하되, LLM의 기본적인 작동 방식을 이해하는 것은 물론 LLM의 한계와 채택 시의 도전 과제도 알고 있어야 합니다.
LLM은 우리의 작업 방식을 뒤바꾸는 다양한 혁신 기술의 기반입니다.
특정 애플리케이션에 맞게 대규모 언어 모델을 미세 조정하려면 어떻게 해야 하나요?
LLM은 초기 사전 학습 단계에서 자체 학습을 통해 파운데이션 모델로 개발된 다음, 분야별 레이블이 지정된 상대적으로 적은 양의 데이터를 사용하여 지도 학습을 통해 특정 응용 분야에 맞게 미세 조정됩니다.
대규모 언어 모델을 사용하면 어떤 산업이 가장 큰 이점을 얻을 수 있을까요?
거의 모든 산업이 LLM의 이점을 발견하고 있습니다. 보건의료, 금융 서비스, 소매유통 분야와 같은 다양한 산업에서 고객 지원 개선 및 비즈니스 프로세스 자동화와 관련된 다양한 사용 사례가 나오고 있습니다.
대규모 언어 모델을 기업 시스템과 통합할 수 있나요?
파운데이션 모델을 엔터프라이즈 데이터로 미세 조정한 다음, 검색 증강 생성을 통해 자체 데이터로 모델을 증강함으로써 대규모 언어 모델을 엔터프라이즈 시스템과 통합하는 경우가 많습니다.