대규모 언어 모델(LLM)이란 무엇인가요?

Mark Jackley | Content Strategist | 2024년 2월 16일

대규모 언어 모델(LLM)은 갈수록 각광받고 있는 인공지능의 한 유형으로서 쿼리에 대해 인간이 작성하는 것과 유사한 서면 응답을 생성합니다. LLM은 대량의 텍스트 데이터를 학습하고 제공된 문맥에 따라 다음 단어 또는 일련의 단어 조합을 예측하는 방법을 학습하며, 나아가 특정 작가 또는 장르의 글쓰기 스타일을 모방할 수도 있습니다.

시험 단계를 넘어선 뒤 2020년대 초부터 본격적으로 화제의 중심이 된 LLM은 독립형 제품 및 다양한 유형의 비즈니스 소프트웨어에 내장된 부가적인 기능으로 발전했습니다. 사용자의 요청을 해석해 유용한 응답을 생성할 수 있는 인상적인 능력을 갖춘 LLM은 자연어 처리, 기계 번역, 콘텐츠 생성, 챗봇, 문서 요약 등 다양한 용도로 사용되고 있습니다.

대규모 언어 모델이란 무엇인가요?

대규모 언어 모델(LLM)은 책, 웹 및 기타 출처에서 가져온 수십억 개의 단어로 구성된 방대한 데이터 세트를 학습한 뒤 쿼리에 대해 인간과 비슷하고 문맥에 부합하는 답변을 생성할 수 있는 인공 지능 시스템입니다. LLM은 질문(LLM 관련 용어로는 '프롬프트')을 이해하고 자연어 응답을 생성하도록 설계되었으므로 고객 질문에 대한 답변, 보고서 정보 요약, 이메일 초안 작성, 심지어 시 및 컴퓨터 코드 작성 등의 작업도 수행할 수 있습니다. 일반적으로 LLM은 학습한 언어의 문법 및 의미를 깊이 이해하고 있으며, 기업의 자체 데이터를 사용하여 더욱 개선할 수도 있습니다.

LLM은 인간 언어를 인식하고 해석할 수 있으므로(인간처럼 완벽하게 이해하지는 못하지만) 자연어 처리 분야의 발전에 크게 기여하고 있습니다. 현 시점에서 가장 잘 알려진 LLM은 OpenAI의 AI 프로그램인 ChatGPT일 것입니다. ChatGPT는 책, 기사, 웹사이트의 수십억 개의 단어를 통해 훈련되었습니다. ChatGPT는 웹 브라우저나 모바일 앱을 통해 직접 액세스할 수도 있고, 프로그래밍 가능한 API를 통해 비즈니스 소프트웨어에 연결할 수 있습니다. 잘 알려진 다른 LLM으로는 Cohere, GPT-4, BARD 등이 있습니다.

LLM 훈련에 사용되는 텍스트 데이터는 데이터베이스에 저장되는 것과 같은 정형 데이터일 수도 있고, 비정형 데이터일 수도 있습니다. 대부분의 기업은 텍스트 메시지, 이메일, 문서 등 방대한 양의 비정형 데이터를 보유하고 있습니다.

LLM의 인기 있는 비즈니스 용도로는 고객 서비스용 챗봇, 디지털 비서, 기존의 단어 단위 번역 도구보다 더 문맥에 부합하고 자연스러운 번역 서비스 등이 있습니다. 또한 LLM은 단백질 구조 예측이나 소프트웨어 코드 작성과 같은 매우 어려운 작업도 수행할 수 있습니다. LLM을 활용하기에 적합한 산업으로는 보건의료, 제약, 금융, 리테일 산업 등이 있습니다. 예를 들어, 의료 기관은 핫라인으로 전화하는 환자들을 분류하기 위해, 투자 회사는 수익 보고서, 뉴스 기사, 소셜 미디어 게시물 등을 선별 및 요약해 주식 동향을 파악하기 위해 LLM을 사용할 수 있습니다. LLM은 기업이 데이터를 관리 및 분석해 비즈니스 가치를 창출하기 위한 인사이트를 확보할 수 있도록 지원합니다. 또한 LLM은 데이터 관리 및 분석, 인사이트 확보 양쪽 모두에서 관련 작업을 인간 분석가보다 빠르게 수행하고 있습니다.

결과적으로 LLM에 대한 시장의 관심이 높아져 가고 있습니다. Valuates Reports의 2023년 연구에 따르면 LLM 관련 글로벌 시장은 연평균 21.4% 성장해 2029년까지 408억 달러에 달할 것으로 예측되었습니다.

LLM과 관련된 몇 가지 핵심 개념이 있습니다. 그 목록은 다음과 같습니다.

  • 자연어. 컴퓨터 코드와 같은 기술적 목적으로 개발되지 않은, 대화 또는 보고서 작성과 같은 일상적인 상황에서 인간이 사용하는 모든 언어를 의미합니다.
  • 자연어 처리. 서면 또는 음성 텍스트의 구조와 의미를 분석할 수 있는 데이터 처리의 일종입니다.
  • 언어 모델. 특정 컨텍스트 내에서 특정 구문 또는 문장의 다음에 올 만한 단어를 높은 정확도로 예측할 수 있는 자연어 모델입니다.

인간과 마찬가지로 LLM은 완벽하지 않습니다. 출력물의 품질은 입력물의 품질, 즉 학습에 사용되는 정보에 따라 달라집니다. 오래된 데이터는 챗봇이 기업의 제품에 대해 잘못된 답변을 제공하는 등의 실수를 초래할 수 있습니다. 데이터가 충분하지 않으면 LLM이 잘못된 답변을 지어낼 수도 있습니다(환각 현상). LLM은 예측에는 능숙하지만 그러한 결론을 도출한 이유는 아직 잘 설명하지 못하고 있습니다. 또한 많은 LLM이 책, 신문 기사, 심지어 Wikipedia 페이지로 훈련되고 있으므로 저작권 침해에 대한 우려도 있습니다. 엄격하게 관리되지 않는 LLM은 민감한 정보나 개인 정보를 응답에 사용하는 것과 같은 보안 문제를 야기할 수도 있습니다.

검색 증강 생성(RAG)이라는 AI 기술은 LLM 출력의 정확성 및 관련성을 개선해 이상 나열한 문제 중 일부를 해결하는 데 도움이 될 수 있습니다. RAG는 기본 모델을 변경하지 않고도 타깃 정보를 추가할 수 있는 방법을 제공합니다. RAG 모델은 지식 저장소(많은 경우 기업이 자체적으로 보유한 데이터에 기반한)를 생성하고 지속적으로 업데이트해 시의적절하고 맥락에 맞는 답변을 제공할 수 있습니다. 예를 들어, RAG를 사용하는 챗봇 및 기타 대화형 시스템은 고객의 질문에 대한 답변을 생성하는 과정에서 재고, 구매자의 선호도 및 과거 구매 이력에 대한 최신 정보를 참고하고, 오래되었거나 LLM의 의도된 운영 목적과 관련이 없는 정보는 제외하도록 할 수 있습니다.

조직별 학습을 시작하기 전에 AI 우수 센터를 구축하면 성공 가능성이 높아집니다. 이 e-book에는 그에 대한 이유와, CoE를 효과적으로 구축하기 위한 팁이 담겨 있습니다.

대규모 언어 모델 FAQ

최고의 대규모 언어 모델 5개는 무엇인가요?

최고의 LLM에 대한 전문가들의 의견은 서로 다르지만, 많은 전문가들이 높이 평가하는 5가지 모델은 OpenAI의 GPT-4, Anthropic의 Claude 2, Meta의 Llama 2, Microsoft Research의 Orca 2, Cohere의 Command입니다. ChatGPT도 OpenAI의 제품입니다.

LLM과 AI의 차이점은 무엇인가요?

인공 지능이란 인간과 유사한 행동이나 능력을 모방할 수 있는 다양한 기술을 포괄하는 광범위한 용어입니다. 대규모 언어 모델은 텍스트, 이미지, 동영상, 음성 언어, 음악 등의 콘텐츠를 생성하는 AI 모델을 포괄하는 용어인 생성형 AI의 한 유형입니다.