Greg Pavlik | Oracle Cloud Infrastructure(OCI), Senior Vice President | 2023년 9월 15일
생성형 인공지능은 비교적 새로운 형태의 AI로서, 과거의 AI 모델들과 달리 학습용 데이터에 기반한 추론을 통해 새로운 콘텐츠를 생성할 수 있습니다. 인간과 유사한 글, 이미지, 오디오, 비디오 등을 만들어낼 수 있는 생성형 AI의 놀라운 능력은 2022년 가을, 최초의 상업용 생성형 AI 챗봇이 대중에게 공개된 이후 전 세계인의 상상력을 사로잡았습니다. McKinsey & Company의 2023년 6월 보고서에 따르면, 생성형 AI는 근로자의 생산성 향상에 기여하여 전 세계 경제에 연간 6조 1천억~7조 9천억 달러의 부가가치를 추가할 수 있는 잠재력을 가지고 있다고 합니다. 또한 해당 보고서는 생성형 AI를 포함한 모든 종류의 AI 기술을 활용한 생산성 향상은 연간 17조 1천억~25조 6천억 달러에 달하는 경제 효과를 불러올 것이라고 예측하였습니다. 즉, 2023년 중반 생성형 AI가 일으켰던 열풍은 AI라는 기술 전체가 가지고 있는 경제적 잠재력의 일부에 불과합니다.
그러나 빛이 강할수록 그림자도 짙어지기 마련입니다. 생성형 AI는 생산성 향상에 대한 놀라운 전망을 불러일으키지만, 부정확성, 개인정보 침해, 지적 재산 노출 등의 새로운 비즈니스 위험, 대규모의 경제 및 사회적 혼란 가능성 등을 함께 내포하고 있습니다. 예를 들어 생성형 AI를 활용한 생산성 향상을 위해서는 현직 근로자들의 대규모 재교육이 필요하고, 생산성 향상이 실제로 이루어지더라도 그 과정에서 많은 근로자들이 현재의 일자리를 잃는 것은 불가피할 것입니다. 따라서 각국 정부의 정책 입안자들과 기술 업계의 일부 경영진들은 AI 규제의 신속한 도입을 촉구하고 있습니다.
본 문서는 생성형 AI의 작동 방식, 가장 즉각적인 적용법, 사용 사례 및 예시, 한계, 비즈니스적 이점 및 위험, 모범적 사용 사례, 생성형 AI와 함께하는 미래 예측 등 생성형 AI가 내포한 가능성 및 위험에 대한 심층적 정보를 제공합니다.
생성형 AI(Generative AI, GAI)는 짧고 간단한 것부터 매우 길고 복잡한 것까지 다양한 길이 및 형식의 텍스트 프롬프트에 응답하는 콘텐츠를 신속하게 생성할 수 있는, 최근 개발된 AI 머신러닝 기술의 하위 집합 중 하나에 붙여진 이름입니다. 용도별 생성형 AI 도구를 사용하여 오디오, 이미지, 비디오 등 다양한 콘텐츠를 제작할 수 있지만, 개중 사람들의 상상력을 자극한 것은 텍스트 중심의 대화형 AI였습니다. 사람들은 텍스트 기반 학습을 거친 생성형 AI 모델과 소통하고, 해당 모델이 제공하는 정보를 통해 학습할 수 있습니다. 마치 다른 사람과 나누는 대화와도 같은 경험입니다.
생성형 AI 기술은 2022년 11월 30일, OpenAI의 GPT-3.5 신경망 모델 기반 챗봇인 ChatGPT가 출시된 후 단 몇 달 만에 전 세계를 강타했습니다. GPT는 생성형 사전학습 트랜스포머(generative pretrained transformer)의 약자로서, 해당 AI 모델의 근간인 신경망 아키텍처를 강조하는 표현입니다.
대화형 챗봇의 초기 모델은 다양합니다. 1960년대 중반 Massachusetts Institute of Technology에서 개발한 ELIZA가 그 시작이었습니다. 그러나 ELIZA를 비롯한 구형 챗봇들은 완전히, 또는 상당 부분 규칙 기반으로 작동하였고 맥락 이해력이 부족했습니다. 사전 정의된 일련의 규칙 및 템플릿을 활용한 제한적인 응답만을 제공했습니다. 반면 현재 각광받고 있는 생성형 AI 모델은 사전 정의된 규칙이나 템플릿을 사용하지 않습니다. 비유해 보자면, 생성형 AI 모델은 실제 세계에 대한 데이터를 학습한, 원시적이고 텅 빈 두뇌(신경망)와도 같습니다. 데이터 학습을 완료한 모델은 각자 독자적인 지능(intelligence)을 개발하게 됩니다. 지능이란 AI모델이 학습한 데이터를 어떤 용도로 활용할지를 결정하는 대표적인 모델입니다. 지능 개발까지 모두 완료된 모델은 사용자의 프롬프트에 대응하여 콘텐츠를 작성하는 데 사용할 수 있습니다. 생성형 AI의 알고리즘은 시스템의 학습 과정에서 자체적으로 개발, 조정되므로 AI 전문가들조차도 그 원리를 정확히 파악하지 못하고 있습니다.
대기업이든 중소기업이든, 모든 기업들은 지금까지 자동화가 그다지 이루어지지 못했던 지식 노동 분야에 기술적 자동화의 이점을 가져다 줄 수 있는 생성형 AI의 잠재력에 주목해야 합니다. 평서문으로 쓰여진 영어 텍스트 프롬프트를 바탕으로 사람과 같은 글, 이미지, 오디오, 비디오를 생성할 수 있는 생성형 AI 도구는 인간 파트너와 협업하여 실제 업무에 사용할 수 있는 콘텐츠를 생성할 수 있다는 점에서 지식 노동 자동화의 근간을 뒤흔들고 있습니다.
Oracle의 Chairman 겸 Chief Technology Officer인 Larry Ellison은 2023년 6월 실적발표회에서 "향후 몇 년 간 많은 기업들이 자사의 데이터에 특화된 대규모 언어 모델들을 학습시킬 것입니다"라고 예측했습니다.
인공지능은 컴퓨터 과학 분야를 떠받치는 큰 기둥 중 하나이고, 생성형 AI는 적어도 현재로서는 인공지능의 하위 분야 중 하나로 분류되고 있습니다. 따라서 생성형 AI는 기존의 AI와 많은 공통점을 공유합니다. 하지만 몇 가지 뚜렷한 차이점도 있습니다.
주목할 만한 또 다른 차이점은, 어느 AI 연구원의 표현을 빌리자면, 생성형 AI용 기초 모델의 학습 비용이 "터무니없이 비싸다"는 것입니다. 생성형 AI 모델 개발을 시작하기 위한 하드웨어 및 대부분의 개발이 실질적으로 진행되는 장소인 클라우드 서비스 사용료만 해도 1억 달러에 달할 수 있습니다. 뿐만 아니라 엄청난 양의 학습 데이터 볼륨을 확보하기 위한 비용이 추가적으로 발생합니다.
핵심 요점
현재 많은 기업들은 기술 기반 자동화를 지식 노동 분야에 적용한다는, 마치 마법과도 같은 일을 해낼 수 있는 기술이라는 기대를 품고 생성형 AI에 주목하고 있습니다. McKinsey 보고서의 표현을 빌리자면, '이전에는 자동화 가능성이 가장 낮았던 분야인 의사 결정 및 협업 관련 활동'을 자동화해 줄 기술이라고도 말할 수 있습니다.
역사적으로 기술을 가장 효과적으로 사용하는 방법은 일상적이거나 반복적인 작업을 자동화하는 것이었습니다. 해당하는 작업들의 자동화와 관련된 의사 결정은 이미 존재하는 정답을 적용하거나, 특정 규칙 하에서 높은 정확도가 보장되는 방법을 사용하는 등의 방식으로 수행되었습니다. 정밀한 작업이 반복되는 제조 공장의 조립 라인, 업계 협회에서 정한 규제 원칙을 따르는 회계 업무 등을 생각해 보면 이해하기 쉬을 것입니다. 반면 생성형 AI는 훨씬 더 정교한 인지적 작업을 수행할 수 있는 잠재력을 가지고 있습니다. 극단적인 예를 들어 보자면, 생성형 AI는 혼란스러운 업계 상황에 대응할 수 있는 아이디어 및 시나리오를 알려 달라는 비즈니스 관리자의 프롬프트에 응답함으로써 기업의 전략 수립을 지원할 수도 있을 것입니다.
McKinsey가 생성형 AI 관련 보고서에서 예측한 바에 따르면, 16개 비즈니스 영역에서 63개의 사용 사례를 평가해 본 결과 생성형 AI를 통해 실현 가능한 수조 달러의 잠재적 부가가치 중 75%는 고객 서비스, 마케팅 및 영업, 소프트웨어 엔지니어링, 연구 개발 등 단 4개 분야와 관련된 사용 사례들에서 발생할 것이라고 합니다. 수익 창출 가능성은 다양한 산업 전반에 걸쳐 보다 고르게 분포되어 있었지만, 개중에서도 눈에 띄는 업종들이 있었습니다. 산업별 매출 증가 가능성 목록에서 1위를 차지한 것은 하이테크 산업이었고, 금융, 제약 및 의료 제품, 교육, 통신, 헬스케어가 그 뒤를 이었습니다.
McKinsey의 예측과 연관성이 있는 Gartner의 분석 결과도 있습니다. Gartner는 2025년 새롭게 개발되는 신약 및 신소재 중 30% 이상은 생성형 AI 기술을 통해 발견될 것이고, 2022년 기준 대기업의 아웃바운드 마케팅 메시지 중 생성형 AI를 활용하여 작성되는 메시지의 비중은 2%이지만, 2025년에는 이 또한 30%로 상승할 것이라고 예측했습니다. 또한 Gartner는 2,500명의 임원들을 대상으로 수행한 온라인 설문조사를 통해 현재 소속 기업에서 AI에 투자하고 있는 분야는 어디인지 질문하였고, '고객 경험 및 고객 유지'가 38%로 가장 높은 비중을 차지한다는 사실을 파악했습니다.
생성형 AI와 관련하여 이와 같이 빠르고 전방위적인 변화가 일어나고 있는 이유는, 수십 년 간 묵묵히 상업적 프로세스를 자동화하고 새로운 가치를 추가해 왔던 기존의 AI 모델들과 달리, ChatGPT가 선보인 인간과 유사한 대화 능력으로 인해 생성형 AI가 전 세계인의 의식 속에 급속도로 자리잡았기 때문입니다. 또한 ChatGPT의 대화 능력은 텍스트 기반 대화 대신 다른 양상에 초점을 맞춘 생성형 AI 기술들에 대한 추가적인 관심으로 이어졌습니다. 많은 이들이 각각의 영역에 특화된 다양한 모델 중 하나를, 또는 개중 다수를 함께 사용하여 텍스트를 작성하거나 음악, 사진, 동영상을 제작하고자 시도하고 있습니다. 또한 이미 많은 기업들이 생성형 AI 관련 실험을 진행 중입니다. 생성형 AI가 비즈니스 및 사회에 미치는 영향은 그만큼 엄청날 것이고, 변화의 속도 또한 급격히 빨라질 것입니다.
생성형 AI가 불러올 가장 분명한 악재는 지식 노동 분야에 발생할 변화입니다. 많은 직책의 업무 수행 방식이 변화할 것이고, 개중 일부는 특히 큰 변화를 겪을 것입니다. 따라서 지식 근로자들은 새로운 역량을 함양해야 합니다. 일부 직업은 사라질 것입니다. 그러나 역사적으로 생성형 AI에 버금가는 대규모의 기술적 변화는 언제나 사라지는 것보다 더 많은(또한 더 많은 가치를 창출하는) 직업을 새롭게 만들어내곤 했습니다. 다만 이와 같은 전망이 지금 당장 일자리를 잃어버릴 가능성이 있는 이들에게 큰 위안이 되지 못하는 것도 사실입니다.
생성형 AI 모델의 작동 방식을 설명할 수 있는 두 가지 접근법이 있습니다. AI의 구체적인 작동 방식에 대한 경험적인 설명은 가능합니다. 특정한 작업을 정확히 수행할 수 있도록 AI의 다양한 신경망 구현을 설계하고, 수십 년 동안 다듬어 온 것은 바로 인간이기 때문입니다. AI 개발자들은 AI 모델의 뉴런이 어떻게 연결되는지 정확히 알고 있으며, 각 모델의 학습 프로세스를 설계했습니다. 그러나 당혹스러운 사실은, 현 시점에서 생성형 AI 모델의 작업 수행 방식을 정확히 파악하고 있는 사람은 아무도 없다는 것입니다.
"신경망 계층 내부에서 일어나는 일들은 인간이 해독하기에는 너무 복잡합니다. 생성형 AI가 창조적인 작업을 수행하는 구체적인 원리는 아직 아무도 파악하지 못하고 있습니다. 적어도 지금은 말이죠." Dean Thompson의 말입니다. 그는 여러 해 동안 LinkedIn 및 Yelp 등 다양한 기업들에게 인수된 다수의 AI 스타트업에서 선임 최고 기술 책임자로 활동하였고, 현재는 대규모 언어 모델(LLM) 담당 수석 소프트웨어 엔지니어로 활동하고 있습니다. 새로운 콘텐츠를 제작할 수 있는 생성형 AI의 능력은 우리가 이미 알고 있는 부분, 즉 AI 모델의 구조 및 학습 방식에서 비롯된 것으로 예측되고 있습니다. 따라서 우리가 이미 알고 있는 요소들과 비교하여 설명할 수 있는 부분도 많지만, GPT-3.5와 같은 생성형 AI 모델들의 내부에서 구체적으로 어떤 일들이 일어나고 있는지(또는 어떤 '생각'을 하고 있는지)는 아직 밝혀지지 않았습니다. 일부 AI 연구자들은 생성형 AI의 작동 방식을 향후 5~10년 내에 파악할 수 있을 것이라고 확신합니다. 반면 그것을 완전히 이해하는 것은 불가능할 것이라고 생각하는 연구자들도 있습니다.
다음은 생성형 AI의 작동 방식에 대해 우리가 확실히 알고 있는 부분들에 대한 간략한 설명입니다.
인간의 두뇌로부터 시작하기. 2004년, Jeff Hawkins는 '생각하는 뇌, 생각하는 기계(On Intelligence)'라는 저서에서 생성형 AI 모델을 이해하는 좋은 출발점은 인간의 두뇌라고 이야기하였습니다. 컴퓨터 과학자, 뇌 과학자, 기업가인 Hawkins는 기술 투자자 Esther Dyson이 주최하는, 시장 선도적 기술 기업가들의 연례 회의였던 PC Forum의 2005년 세션에서 자신의 연구 결과를 발표했습니다. Hawkins는 인간의 뇌는 다음에 일어날 일을 뉴런 단위로, 지속적으로 예측하고, 예측과 실제로 발생한 사건 사이의 차이점을 학습하는 방식으로 작동한다는 가설을 세웠습니다. 뇌는 예측 능력을 향상시키기 위해 내부적으로 세계에 대한 인식을 구축합니다. 그의 이론에 따르면 인간 지능은 이와 같은 과정에서 생겨납니다. Hawkins의 이론의 영향을 받은 결과물인지는 알 수 없지만, 생성형 AI는 정확히 그와 같은 방식으로 작동합니다. 또한 놀랍게도 마치 지능이 있는 것처럼 행동합니다.
인공 신경망 구축하기. 모든 생성형 AI 모델은 소프트웨어적으로 인코딩된 인공 신경망에서부터 시작됩니다. Thompson은 인공 신경망에 대한 좋은 시각적 은유는 스프레드시트를 3차원적으로 상상해 보는 것이라고 말합니다. 실제 뉴런이 뇌 안에 쌓여 있는 것과 유사하게 인공 뉴런도 계층 단위로 층층이 쌓여 있기 때문입니다. 심지어 각각의 뉴런을 '셀(cell)'이라고 부르기는 AI 연구자들도 있습니다. 각 셀에는 네트워크를 구성하는 다른 셀들과의 상호 연관성과 관련된 공식이 포함되어 있으며, 해당 공식을 통해 각자 다른 강도로 연결되는 뉴런 간의 연결 방식을 모방할 수 있다고 Thompson은 설명합니다.
각 계층마다 수십, 수백, 또는 수천 개의 인공 뉴런이 존재할 수도 있지만, AI 연구자들이 집중하는 부분은 뉴런의 갯수가 아닙니다. 연구자들은 뉴런 자체가 아닌 뉴런 간의 연결점 갯수를 통해 모델을 측정합니다. 뉴런 간 연결 강도는 일반적으로 '가중치(weights)' 또는 '매개변수(parameters)'라고 부르는 셀 방정식의 계수에 의해 달라집니다. 예를 들어, 'GPT-3 모델의 매개변수는 1,750억 개이다'라는 표현은 바로 연결을 정의하는 계수의 숫자를 의미합니다. 최신 버전인 GPT-4의 매개변수는 수조 개에 달한다는 소문이 있지만 아직 확인되지는 않았습니다. 특정 양식의 콘텐츠 생성에 특화된, 독자적 특성을 갖춘 몇 가지 신경망 아키텍처들이 존재합니다. 예를 들어 트랜스포머 아키텍처는 대규모 언어 모델에 가장 적합한 것으로 평가받고 있습니다.
신생 신경망 모델 학습시키기. 대규모 언어 모델의 학습은 방대한 양의 텍스트를 입력하고, 문장 시퀀스의 다음에 올 단어, 또는 문장 집합 간의 올바른 순서와 같이 간단한 예측 작업을 반복하는 방식으로 이루어집니다. 그러나 실제 신경망 모델은 단어가 아닌 '토큰'이라는 단위로 작동합니다.
"자주 쓰이는 단어들은 각자 하나씩의 자체 토큰을 가지게 되고, 흔히 쓰이지 않는 단어인 경우 여러 개의 토큰을 갖게 됩니다. 그리고 (영문 텍스트의 경우) 일부 토큰은 뒤에 'th'가 붙는 공백 하나에 불과한 경우도 있습니다. 'th'를 포함한 3개 문자의 나열이 그만큼 흔하기 때문이죠." Thompson은 설명합니다. 생성형 AI 모델은 예측을 수행할 때마다 특정 인공 뉴런 스택의 최하위 계층에 토큰을 입력합니다. 해당 계층이 이를 처리하고, 다음 계층으로 출력을 전달하고, 다음 계층은 이를 처리하여 전달하는 식으로 스택의 최상위 계층에서 최종 출력을 도출할 때까지 반복됩니다. 스택의 크기는 다양하지만 일반적으로는 수천 개나 수백만 개까지는 아닌, 수십 개의 계층 정도로 구성됩니다.
초기 학습 단계인 모델의 예측 결과는 그다지 뛰어나지 않습니다. 그러나 모델은 토큰을 예측할 때마다 학습용 데이터와 대조하여 정확성을 검사합니다. 예측이 맞았든 틀렸든, '역전파(backpropagation)' 알고리즘은 해당 예측을 수행한 스택의 각 셀에서 매개변수, 즉 수식의 계수를 조정합니다. 조정 작업의 목표는 올바른 예측 가능성을 높이는 것입니다.
"정답에 대해서도 동일한 조정 작업을 수행합니다. 어느 정답의 확실성이 단 30%에 불과한 경우라도, 그 30%는 여전히 다른 모든 가능한 답변 중 가장 높은 정답률이기 때문입니다." Thompson의 설명입니다. "역전파 알고리즘은 그 30%를 30.001%, 또는 다른 얼마가 되었든 그보다 조금이라도 더 높은 수치로 바꾸기 위해 노력합니다."
수조 개의 텍스트 토큰을 대상으로 같은 과정을 반복한 모델은 다음 토큰 또는 단어를 예측하는 데 매우 능숙해집니다. 초기 학습을 마친 생성형 AI 모델은 인간의 피드백을 통한 강화 학습(reinforcement learning from human feedback, RLHF)과 같은 지도 학습 기법을 통한 미세 조정을 거치기도 합니다. RLHF는 AI 모델의 결과물을 인간 리뷰어에게 제공하고, 리뷰어는 엄지손가락을 올리거나 내리는 버튼을 누르는 등의 방법으로 긍정 또는 부정의 이분법적 평가를 내리고, 평가 내용을 다시 모델에 피드백하는 학습 기법입니다. RLHF는 대중의 큰 관심을 불러모은 ChatGPT 챗봇의 개발 과정에서 OpenAI의 GPT 3.5 모델을 미세 조정하는 데 사용되었습니다.
결과적으로, 이 모델이 우리의 질문에 답할 수 있는 원리는 무엇인가요? 아직은 알 수 없습니다. Thompson은 생성형 AI의 작동 원리에 대한 우리의 이해 수준을 다음과 같이 설명했습니다. "제가 드리고자 하는 설명의 대전제는, '아직 아무도 모른다'는 것입니다. 생성형 AI가 사용자의 질문 전체를 토큰으로 이루어진 시퀀스로 받아들이고, 첫 번째 계층에서 모든 토큰을 동시에 처리한다는 사실은 알려져 있습니다. 그리고 첫 번째 계층의 산출물이 다음 계층에서 처리되는 식으로, 점차 상위 스택으로 올라가며 처리된다는 사실도 알려져 있습니다. 그리고 마지막으로 생성형 AI가 최상위 계층에서 예측을 수행한다는 것, 다시 말해서 첫 번째 토큰을 생성하고, 전체 시스템은 생성된 첫 번째 토큰을 사용하여 그 다음에 올 토큰을 생성한다는 사실도 알려져 있습니다.
그렇다면, 논리적으로 떠올릴 만한 다음 질문은 이것입니다. 생성형 AI는 이 모든 처리 과정에서 무엇에 대해, 그리고 어떻게 '생각'했을까요? 그 모든 계층에 걸쳐 어떤 일이 일어나고 있는 것일까요? 아쉽지만, 그 질문에 대한 대답은 '모른다' 입니다. 아직 그 아무도 모르고 있습니다. 해당 과정을 연구할 수는 있습니다. 관찰할 수는 있습니다. 하지만 우리에게는 생성형 AI의 복잡한 작동 방식을 분석할 능력이 없습니다. 생성형 AI를 분석하고자 시도하는 것은 인간의 뇌를 F-MRI(기능적 자기공명영상)를 사용하여 들여다보려는 것과 같은 일입니다. 생성형 AI 모델의 작동 방식에 대해서는 이와 같이 조악한 설명밖에는 불가능합니다. 정확히 알고 있는 사람은 아무도 없습니다."
논란의 여지가 있는 주장이지만, 2022년 가을 GPT-4를 미리 접해 본 십수명의 연구자들은 해당 모델이 갖춘 복잡한 문제에 대응하는 지능과 광범위한 전문성을 바탕으로 GPT-4가 일종의 일반 지능에 도달했다는 결론을 내렸습니다. 즉, GPT-4 모델은 인간의 뇌처럼 세계에 대한 내부 모델을 구축했고, 해당 모델을 사용하여 주어진 질문에 대한 추론을 수행한다는 것입니다. 해당 연구원들 중 한 사람은 "This American Life" 팟캐스트에 출연하여 GPT-4가 그를 놀라게 만들었던 사례를 공유했습니다. 그는 GPT-4에게 "매우 우울한 사람의 문체로 쓰여진 초코칩 쿠키 레시피를 알려주세요"라고 물었고, 모델은 이렇게 대답했습니다. "재료: 부드러운 버터 1컵(부드럽게 만들 에너지가 있다면). 바닐라 추출물 1 티스푼(가짜 행복의 향기가 나는 인공 향료). 약간 달콤한 초콜릿 칩 1컵(결국 녹아 없어질 작은 기쁨)."
생성형 AI의 중요성을 이해하기 좋은 방법은 해당 모델을 개방형, 창의적 콘텐츠 작성을 위한 계산기라고 생각하는 것입니다. 계산기가 일상적이고 평범한 수준의 계산을 자동화하여 사람은 보다 높은 수준의 작업에 집중할 수 있게 해주는 것처럼, 생성형 AI는 지식 노동의 대부분을 차지하는 일상적이고 평범한 작업을 자동화하여 사람은 보다 높은 수준의 업무에 집중하도록 지원해 줄 수 있는 잠재력을 지니고 있습니다.
마케터들이 종종 맞닥뜨리는, 구조화되지 않고, 일관성이 없고, 파편화된 데이터로부터 실용적인 인사이트를 확보해야 하는 도전 과제를 예로 들어 보겠습니다. 지금까지 사용되어 온 방식의 첫 번째 단계는 모든 데이터를 통합하는 것입니다. 소셜 미디어, 뉴스, 고객 피드백 등 서로 다른 데이터 소스에 동일한 구조를 적용하기 위해서는 상당한 수준의 커스텀 소프트웨어 엔지니어링이 필요합니다.
"반면 LLM을 사용하면 다양한 소스로부터 추출한 정보를 프롬프트에 직접 입력하고, 핵심 인사이트나 우선순위가 높은 피드백이 무엇인지 묻거나, 입력한 데이터에 대한 감성 분석을 수행하라고 명령하면 끝입니다. 바로 결과물을 출력해 줍니다." Duolingo의 AI 및 보안 담당 Senior Engineering Manager인 Basim Baig의 말입니다. "LLM의 장점은 방대하고 비싼 엔지니어링 단계를 생략시켜 준다는 것입니다."
나아가 Thompson은 제품 마케터가 분석을 위해 자유 형식 텍스트에 태그를 지정하는 작업에도 LLM을 사용할 수 있을 것이라고 제안합니다. 예를 들어, 소셜 미디어 이용자들이 특정 제품에 대해 언급한 내용이 저장된 방대한 데이터베이스가 있다고 가정해 보겠습니다. 해당 데이터를 분석하기 위해 LLM 및 다른 기술들을 사용하여 다음과 같은 작업을 수행하는 소프트웨어를 작성할 수 있습니다.
해당 분석 결과는 다음과 같이 활용할 수 있습니다.
생성형 AI는 점차 다양해지고 있는 각종 신경망 변형에 기반한 광범위한 애플리케이션 모음을 통칭하는 표현입니다. 모든 생성형 AI는 본 문서의 '생성형 AI의 작동 방식' 섹션에서 설명한 것과 같은 특징을 공유하지만, 그 구현 방식은 이미지, 텍스트 등의 다양한 매체를 지원하고 관련 연구 및 산업의 발전 성과를 적용하는 과정에서 각자 달라집니다.
신경망 모델은 인공 뉴런의 반복적 패턴 및 그 상호 연결 구조를 활용합니다. 생성형 AI를 포함한 모든 용도의 신경망 설계는 동일한 패턴의 뉴런을 수백 또는 수천 번 반복하는 방식으로 이루어지고, 동일한 매개변수를 재사용하는 것이 일반적입니다. 이는 '신경망 아키텍처'로 불리는 아키텍처의 필수 요소입니다. 새로운 아키텍처의 발견은 1980년대부터 AI 혁신을 위한 중요한 과제였고, 보통 새로운 매체를 지원하기 위한 목적으로 추진되곤 했습니다. 그러나 일단 새로운 아키텍처를 발견하고 나면 미처 예상하지 못했던 방식으로 그를 활용함으로써 추가적인 발전이 이루어지는 경우가 많았습니다. 추가적인 혁신은 다양한 아키텍처의 서로 다른 요소들을 결합하는 방식으로 이루어집니다.
가장 초기에 발견되었고, 여전히 가장 일반적으로 사용되는 아키텍처 두 가지는 다음과 같습니다.
RNN은 여전히 널리 사용되고 있지만, 다른 한편으로는 RNN을 개선하기 위한 노력도 계속되었고 다음과 같은 획기적 발전이 이루어졌습니다.
여러 연구소, 민간 기업, 오픈 소스 기여자 등의 노력에 힘입어 보다 높은 수준에서 신경망 아키텍처 및 애플리케이션을 혁신할 수 있는, 영향력 있는 모델이 개발되었습니다. 예를 들어 학습 과정, 학습 피드백을 통합하여 모델을 개선하는 방법, 여러 AI 모델을 결합하여 생성형 AI 애플리케이션을 개발하는 방법 등과 관련하여 매우 중요한 혁신이 이루어졌습니다. 다음은 가장 중요한 생성형 AI 모델 혁신 사례 중 몇 가지에 대한 요약문입니다.
생성형 AI의 구체적인 사용 방안은 이제 막 논의되기 시작한 주제이지만, 기업은 자사의 운영에 생성형 AI를 적용하여 얻을 수 있는 이점을 간단히 파악할 수 있습니다. 생성형 AI가 고객 상호 작용, 영업 및 마케팅, 소프트웨어 엔지니어링, 연구 개발의 주요 영역을 어떻게 변화시킬 수 있을지 예측해 보겠습니다.
고객 서비스 분야의 경우, 초기 단계의 AI 기술을 활용하여 각종 프로세스를 자동화하고 고객 셀프 서비스를 도입했지만, 이는 새로운 고객 불만을 야기하기도 했습니다. 생성형 AI는 다양한 언어 및 지역에 맞춰 조정 가능한 챗봇을 통해 고객과 서비스 담당자 모두를 지원하고, 보다 개인화되고 접근하기 쉬운 고객 경험을 제공할 수 있습니다. 고객의 문제 해결에 인적 개입이 필요한 경우, 고객 서비스 담당자는 생성형 AI 도구와 실시간으로 협업하여 적합한 전략을 파악하고, 고객과의 상호 작용 속도 및 정확성을 개선할 수 있습니다. 생성형 AI는 대기업의 지식 기반을 신속하게 검색하여 고객 불만에 대한 새로운 솔루션을 작성해 줍니다. 따라서 서비스 담당자는 해결책을 찾거나 고객의 인내심이 바닥날 때까지 기존의 자동 응답 및 통화 전환 시스템에 의존할 필요 없이 고객의 문제를 빠르고 효과적으로 해결할 수 있는 역량을 갖출 수 있습니다.
마케팅 분야의 경우, 생성형 AI는 다양한 소스로부터의 데이터 통합 및 분석을 자동화하여 인사이트 확보 시간을 획기적으로 단축하고, 보다 나은 정보에 기반한 의사 결정 및 신속한 시장 진출(go-to-market) 전략 개발에 즉각적으로 기여할 수 있습니다. 마케터는 생성형 AI로 수집한 정보를 AI로 도출한 인사이트와 함께 사용하여 보다 정확한 타기팅에 기반한 광고 캠페인을 작성할 수 있습니다. 마케팅 담당 직원은 생성형 AI를 활용하여 고객 인구 통계 및 구매 행동 데이터를 수집하는 시간을 줄이고, 캠페인 결과 분석 및 신규 아이디어 브레인스토밍에 그만큼 더 많은 시간을 할애할 수 있게 됩니다.
B2B 마케팅 에이전시인 Stein IAS의 Chairman 겸 Chief Brand Officer인 Tom Stein은 자사를 포함한 모든 마케팅 대행사들이 생성형 AI를 가능한 한 빨리 활용할 수 있는 방식을 모색 중이라고 말했습니다. 그러나 Stein은 마케팅 대행사의 백엔드 프로세스에 생성형 AI를 보다 간단하고 빠르게 적용할 수 있는 방법도 있다고 덧붙였습니다.
"일반적으로 우리 회사로 보내어지는 모든 RFI(정보제공요청서) 중 70~80%는 다른 모든 RFI와 같은 정보를 요구합니다. 발신 기업의 상황에 따라 약간의 차이가 있는 정도입니다." 2023 Cannes Lions Creative B2B Awards의 심사위원장을 맡기도 했던 Stein은 설명합니다. "수많은 AI 도구를 사용해 반복적인 작업을 자동화하는 것은 그리 복잡한 일이 아닙니다. (중략) 자동화를 통해 해당 작업에 소요되던 시간 중 80%를 절약하고, RFI에 추가적인 가치를 더하고 내용을 보강하는 데 그만한 시간을 더 사용할 수 있다면, 이는 모든 면에서 분명한 이익이라고 할 수 있습니다. 뿐만 아니라 RFI 외에도 자동화 가능한 프로세스가 여럿 있습니다."
소프트웨어 개발 분야의 경우, 소프트웨어 개발자는 생성형 AI를 활용하여 계획부터 유지 관리에 이르는 모든 단계별 프로세스를 간소화하고 속도를 향상시킬 수 있습니다. 새로운 프로그램의 초기 구상 단계에서 생성형 AI 도구는 대량의 데이터를 분석 및 정리하고, 다양한 프로그램 구성을 제안합니다. 코딩이 시작되면 AI는 프로그램 런칭 전후에 걸쳐 코드를 테스트 및 수정하고, 오류를 식별하고, 진단을 실행하고, 수정 사항을 제안합니다. Thompson은 엔터프라이즈 소프트웨어 프로젝트의 경우 다양한 프로그래밍 언어 및 분야가 통합되어 있는 경우가 많으므로 본인을 포함한 소프트웨어 엔지니어들은 AI를 활용하여 본인에게 익숙하지 않은 영역에 대해 훨씬 빠르게 배울 수 있게 되었다고 말했습니다. 또한 Thompson은 생성형 AI 도구가 그에게 익숙하지 않은 코드에 대한 설명을 제공하고, 특정한 문제를 식별해 주기도 했다고 덧붙였습니다.
R&D분야의 경우, 제품 설계의 초기 단계에 생성형 AI를 사용하여 관련 시장 조사의 속도 및 범위를 향상시킬 수 있습니다. 이후 새로운 제품 관련 시뮬레이션 및 테스트를 수행하기 전에 AI 프로그램, 특히 이미지 생성 기능이 있는 AI 프로그램을 통해 세부 디자인을 미리 생성합니다. 작업자들은 생성형 AI 도구를 사용하여 R&D 주기 전반에 걸쳐 빠르고 효과적으로 제품 설계를 조정할 수 있습니다.
Oracle의 창립자 Larry Ellison은 2023년 6월 실적 발표에서 "전문화된 LLM을 사용하여 신약 개발을 가속화함으로써 더 많은 생명을 구할 수 있을 것"이라고 말했습니다. 신약 개발은 부정확하거나 검증할 수 없는 정보를 지어내기도 하는 생성형 AI 모델의 특징을 긍정적으로 활용할 수 있는 R&D 분야입니다. 생성형 AI 모델을 사용하여 새로운 치료법을 탐색하는 과정에서 새로운 분자 및 단백질 서열을 식별해 낼 수도 있기 때문입니다. 이와는 별도로 Oracle의 자회사인 Cerner Enviza는 미국 식품의약국(FDA) 및 John Snow Labs와 함께 '대규모 인구 대상 의약품 효과 연구'라는 도전 과제에 AI 도구를 적용하기 위한 파트너십을 구축하였습니다. Oracle의 AI 전략은 자사의 클라우드 애플리케이션 및 클라우드 인프라 전반에 인공 지능을 적용하는 것입니다.
생성형 AI는 다양한 작업의 수행 속도를 가속화하거나 완전히 자동화할 수 있는 광범위한 잠재력을 가지고 있습니다. 기업은 자사의 운영에 생성형 AI를 도입하여 최대의 혜택을 누릴 수 있는 방법을 신중하고 구체적으로 계획해야 합니다. 구체적인 사용 사례는 다음과 같습니다.
기업이 생성형 AI를 통해 얻을 수 있는 이점 중 대부분은 지식 합성, 인간-AI 협업, 속도 증가라는 세 가지 속성으로부터 비롯됩니다. 하단에 언급된 많은 이점은 과거 초기 AI 모델 및 자동화 도구와 관련하여 예측되었던 이점들과 유사하지만, 그 세 가지 속성 중 하나 이상을 갖춘 기업은 해당 이점을 보다 빠르고, 쉽고, 효과적으로 누릴 수 있게 될 것입니다.
각 기업은 생성형 AI를 통해 자사의 제도적 지식 및 지적 재산(IP)을 학습한 맞춤형 AI 모델을 구축할 수 있으며, 지식 근로자들은 맞춤형 AI 모델이 탑재된 소프트웨어를 사용하여 동료 직원들과 대화할 때와 같은 방식으로 AI의 도움을 요청할 수 있습니다. 전문화된 생성형 AI 모델은 전사적 지식 기반으로부터 방대한 정보를 놀라운 속도로 합성하여 답변을 제공합니다. 생성형 AI를 활용한 접근법은 동일한 결과물을 제공하는 프로그램을 직접 개발하기 위해 대체로 복잡하고, 효과도 떨어지고, 비용도 더 많이 드는 소프트웨어 엔지니어링을 활용할 필요성을 줄이거나 완전히 없애 줄 뿐만 아니라, 기존의 접근법으로는 발견하지 못했던 새로운 아이디어 및 연결성을 찾아낼 수도 있습니다.
생산성 향상: 지식 근로자는 생성형 AI를 사용하여 일상적인 작업에 소요되는 시간을 줄일 수 있습니다. 해당하는 작업의 사례로는 신규 프로젝트에 필요한 지식에 대한 속성 교육, 데이터 정리 또는 분류, 연구를 위한 인터넷 검색, 이메일 초안 작성 등이 있습니다. 생성형 AI를 활용하면 기존에는 대규모의 팀 또는 오랜 시간을 필요로 했던 작업을 보다 적은 수의 직원이 단시간에 완료할 수 있게 됩니다. 예를 들어, 여러 명의 프로그래머들로 구성된 팀이 결함이 내재된 코드를 직접 분석한다면 문제를 파악하고 해결하는 데 몇 시간이 필요할 수도 있는 반면, 생성형 AI 도구는 순식간에 오류를 찾아내고 적절한 수정 방안도 함께 제공해 줍니다. 일부 생성형 AI 모델은 광범위한 지식 노동 분야에 대한 평균 또는 그 이상의 기술을 보유하고 있으며, 협업을 통해 인간 파트너의 생산성을 크게 향상시켜 줍니다. 예를 들어, 하급 제품 관리자도 AI 코치를 활용한다면 적어도 평균 수준의 프로젝트 관리자 역할을 수행할 수 있습니다. 지식 근로자들은 이상의 모든 기능들을 활용하여 프로젝트 완수 능력을 크게 향상시킬 수 있습니다.
비용 절감: 생성형 AI 도구의 빠른 처리 속도를 통해 프로세스 완료에 소요되는 비용을 줄일 수 있습니다. 특정 작업을 수행하는 데 걸리는 시간이 절반으로 줄어들면 관련 비용도 절반으로 줄어들게 됩니다. 또한 생성형 AI는 오류를 최소화하고, 다운타임을 제거하고, 중복 및 기타 비용이 많이 드는 비효율성을 식별하는 데에도 사용 가능합니다. 그러나 생성형 AI에도 한계는 있습니다. 생성형 AI는 때에 따라 잘못된 내용을 지어내기도 하므로 여전히 사람의 감독과 품질 관리를 필요로 합니다. 하지만 인간과 AI가 협업한다면 인간 혼자 작업하는 것보다 더 짧은 시간에 훨씬 더 많은 작업을 수행할 수 있고, AI 도구만을 사용할 때보다 더 정확하고 효율적으로 작업할 수 있으므로 결과적으로 작업 비용이 절감됩니다. 예를 들어, 신제품을 테스트하는 과정에서 생성형 AI를 활용하여 기존의 테스트용 도구를 사용할 때보다 더욱 정교하고 상세한 시뮬레이션을 생성할 수 있습니다. 이는 결과적으로 신제품 테스트에 소요되는 시간과 비용의 절감으로 이어집니다.
고객 만족도 향상: 고객은 생성형 AI 기반 셀프 서비스 및 고객 서비스 담당자의 귀에 '직접 속삭여주는' 생성형 AI 도구들을 통해 실시간으로 원하는 정보를 얻고, 한층 탁월한 맞춤형 고객 경험을 만끽할 수 있습니다. 기존의 AI 기반 고객 서비스 챗봇은 때로 답답할 만큼 제한적인 대답만을 제공하지만, 현재 ChatGPT가 보여 주는 수준의 대화 기능을 갖추고 각 기업별 데이터를 활용하여 학습한 생성형 AI 모델이 향후 훨씬 더 높은 수준의 고객 경험을 제공할 것이라는 사실은 간단히 예측 가능합니다.
보다 나은 정보 기반 의사 결정: 기업별 데이터에 기반한 특화 학습을 거친 생성형 AI 모델은 시나리오 모델링, 위험 평가 및 기타 정교한 예측 분석 기법을 활용하여 상세한 인사이트를 제공합니다. 기업의 의사 결정권자는 인간 분석가나 오래된 기술을 통해 생성하는 것보다 더욱 광범위한 데이터에 기반하여 신속한 분석 결과를 제공하는 생성형 AI 도구를 활용 가능합니다. 생성형 AI가 제공하는 개인화된 권장 사항 및 실용적 전략을 활용하면 업계 현황 및 소속 기업의 업계 내 입지를 보다 명확하게 이해할 수 있습니다.
예를 들어, 의사 결정권자는 전사적 자원 관리(ERP) 시스템에서 수집한 내부 데이터 및 종합적인 외부 시장 조사 결과를 결합한 후 소속 기업에 특화된 생성형 AI 모델을 통해 분석함으로써 성수기에 대비한 수요 예측을 더욱 정확하게 수행하고, 보다 나은 재고 할당 계획을 수립할 수 있습니다. 개선된 재고 할당 계획은 과잉 구매 및 재고 부족을 최소화하고, 잠재 매출을 극대화하는 데 기여합니다.
제품 출시 기간 단축: 생성형 AI를 활용하면 신제품의 프로토타입 및 초안을 더욱 빠르게 제작하고, 진행 중인 제품 개발 작업을 미세 조정하고, 기존 개발 프로젝트 관련 테스트/문제 해결 작업을 수행하여 개선책을 훨씬 빠르게 찾아낼 수 있습니다.
품질 관리: 기업별로 특화된 생성형 AI 모델은 기업의 소비자용 사용자 설명서, 동영상 및 기타 콘텐츠 간의 격차와 불일치를 포착해낼 가능성이 높습니다.
생성형 AI의 구체적 이점 사례 | |||
---|---|---|---|
지식 통합 | 인간-AI 협업 | 신속성 | |
생산성 향상 | 데이터를 정리하고, 연구를 촉진하고, 신제품 초안을 작성합니다. | 새로운 분야를 학습하는 직원들을 지원하고, 새로운 문제 해결 방법을 제안합니다. | 지식 근로자들이 새로운 프로젝트를 더욱 빠르게 완료할 수 있도록 지원합니다. |
비용 절감 | 중복되고 비효율적인 요소들을 파악하여 워크플로를 개선합니다. | 인적 오류를 최소화하고, 인간 근로자와의 공동 감독을 통해 가동 중지 시간을 줄입니다. | 작업을 더 빠르게 완료합니다(작업 시간이 반으로 줄면, 비용도 반으로 감소합니다). |
고객 만족도 향상 | 고객 계정 정보를 신속히 정리 및 검색하여 문제 해결 시간을 단축합니다. | 챗봇을 개선하여 간단한 고객 상호작용을 자동화하고, 직원의 도움이 필요한 경우 담당자에게 보다 나은 정보를 제공합니다. | 고객 및 서비스 담당자 양측 모두에게 실시간 계정 업데이트 및 정보를 제공합니다. |
더 나은 정보에 기반한 의사 결정 | 시나리오 모델링 및 위험 평가 등의 예측 분석 결과를 바탕으로 신속히 인사이트를 확보합니다. | 의사 결정권자에게 개인화된 권장 사항 및 실행 가능한 전략을 제공합니다. | 인간 분석가 또는 구식 기술보다 보다 광범위한 데이터를 분석하고 더욱 빨리 분석 결과를 도출합니다. |
제품 출시 가속화 | 프로토타입 및 '최소기능제품(MVP)'을 제작합니다. | 기존 프로젝트에 대한 테스트 및 문제 해결 작업을 수행하여 개선책을 찾아냅니다. | 조정 내역을 보다 신속하게 구현합니다. |
교육 및/또는 연구적 목적으로 생성형 AI 도구를 사용해 본 사람이라면 누구든 이미 잘 알려진 생성형 AI의 한계를 경험해 보았을 것입니다. 바로 거짓된 정보를 지어낸다는 것입니다. 해당 모델은 한 단어의 바로 다음에 쓰일 단어만을 예측하므로, 학습 데이터에 기반한 추론을 통해 마치 진실처럼 느껴지는 거짓 정보를 제공할 수 있습니다. 이것이 바로 AI 연구자들이 이야기하는 환각 현상입니다. 현재 생성형 AI 도구 사용을 위해서는 인간 협력자가 반드시 필요한 이유이기도 합니다. 생성형 AI를 구현하는 기업은 환각 현상을 비롯한 해당 모델의 다양한 한계에 대해 대비하고, 주의깊게 관리해야 합니다. 생성형 AI와 관련하여 비현실적인 기대치를 설정하거나 해당 모델을 효과적으로 관리하지 못할 경우, 기업의 성과 및 평판에 약영향을 끼칠 수도 있습니다.
생성형 AI는 위험 스펙트럼의 양쪽 모두에서 극단적인 반응을 이끌어냈습니다. 인공지능이 인류의 멸종을 초래할 것이라고 우려하는 이들이 있는가 하면, 반대편에는 인공지능이 세상을 구할것이라고 주장하는 이들도 있습니다. 양 극단 모두 본 문서에서 다루기에는 적절치 못한 주제입니다. 하지만 AI 기술을 도입하고자 하는 경영자들이 그와 관련된 잠재적 위험 완화 조치를 취하기 위해서는 다음과 같이 중대한 위험 및 우려 사항에 대하여 반드시 파악하고 있어야 합니다.
신뢰도 및 안정성: 생성형 AI 모델은 상황에 따라 부정확한 논지를 제시하거나, 완전히 거짓된 정보를 지어내기도 합니다. 또한 많은 모델이 특정 일자 이전의 정보들로만 구성된 오래된 데이터에 기반하여 학습하므로 작년의 시장에는 적합했을지 몰라도 올해의 시장과는 더 이상 관련성이 없거나 유용하지 않은 답변을 제공할 가능성이 있습니다. 예를 들어, 공급망 운영을 개선하고자 하는 기업은 오래된 데이터에 기반한 자사 AI 모델의 제안이 시대에 뒤떨어지고, 끊임없이 변화하는 글로벌 경제 상황에 적용하기에는 적합하지 않다고 판단할 수 있습니다. 사용자는 생성형 AI가 제공하는 모든 답변을 활용하기에 앞서 반드시 검증함으로써 그 내용의 정확성 및 관련성을 확인해야만 합니다.
개인 정보/지적 재산: 생성형 AI 모델은 프롬프트에 포함된 정보를 바탕으로 계속해서 학습하는 경우가 많습니다. 기업, 특히 의료 기관과 같이 고객들로부터 민감한 개인 정보를 수집하는 기업은 보호 대상인 IP 또는 기밀 데이터가 노출되지 않도록 주의해야 합니다. 만약 생성형 AI 모델이 그와 같이 민감한 정보에 액세스하게 되면 정보 노출 가능성이 증가할 수 있습니다.
한층 위협적인 소셜 엔지니어링: 위협 행위자들은 이미 생성형 AI에 기반한, 마치 진짜처럼 느껴지는 소셜 엔지니어링 및 기타 사이버 공격 수단을 통해 더욱 개인화된 공격을 수행하고 있습니다.
"온라인 채팅의 경우 이미 대화하는 대상이 챗봇인지 사람인지 구별하기가 매우 어려워질 정도가 되었습니다." Duolingo의 AI 및 보안 엔지니어인 Baig는 말합니다. "범죄자들이 사람들을 속여넘길 수 있는 콘텐츠를 대량으로 생성하는 것이 훨씬 간단해졌습니다."
출력물 품질 및 독창성 저하: 생성형 AI는 제품과 콘텐츠를 더 쉽고 빠르게 제작할 수 있지만, 결과물의 품질을 보장하지는 않습니다. 인간과의 협업 없이 AI 모델에만 의존할 경우, 평범하고 창의성이 결여된 제품만이 양산될 수도 있습니다.
편향성: 편향성을 띠는 데이터로 학습한 생성형 AI 모델은 편향된 결과물을 출력하게 됩니다. 편향성의 수준은 단순한 관점의 차이에서부터 확실히 유해하고 편향적인 콘텐츠에 이르기까지 다양합니다. 예를 들어, 어느 기업이 과거 특정한 유형의 직원만을 채용한 경우, 막상 해당 기업은 그와 같은 채용 기준을 폐기하였더라도 AI는 사전 학습한 '이상적' 인재 유형에 맞지 않는다는 이유로 자격이 충분한 후보자를 탈락시킬 수도 있습니다.
섀도 AI: 직원이 소속 기업의 공식 승인 또는 정보에 기반하지 않은 생성형 AI를 임의로 사용하는 경우 잘못된 정보를 생성하거나 다른 조직의 저작권을 위반하는 등의 의도하지 않았던 상황이 발생할 수 있습니다.
모델 붕괴: AI 연구자들은 시간이 지날수록 생성형 AI 모델의 유용성이 저하되는 모델 붕괴(model collapse)라는 현상을 발견했습니다. AI가 생성한 콘텐츠가 확산될수록 추후 개발되는 AI 모델들은 오류가 포함된 합성 데이터를 학습하게 되고, 결국 AI 모델의 최초 학습 기반이 되었던 사람이 생성한 데이터의 특성을 '잊어버리고' 만다는 것입니다. 인터넷상의 정보가 갈수록 AI 콘텐츠로 채워지다 어느 순간 임계점에 도달하게 되면 AI 모델의 출력 품질을 저하시키는 부정적인 피드백 루프가 발생할 가능성이 있습니다.
AI 규제: 생성형 AI는 극히 새로운 기술이므로 적용 가능한 규제가 많지 않습니다. 그러나 각국 정부는 생성형 AI의 규제 방안을 연구 중입니다. 중국 등 몇몇 국가에서는 이미 생성형 AI 모델의 학습 방법 및 해당 모델을 활용하여 생산 가능한 내용에 대한 규제 조치를 제안했습니다. 생성형 AI에 대한 규제를 시행하는 국가가 갈수록 늘어날 예정이므로 기업, 특히 글로벌 기업은 관련 규제를 준수하고 해당 기술을 오용함으로서 발생 가능한 벌금이나 형사 고발 등을 피하기 위해 생성형 AI 관련 법률의 변화 내역을 지속적으로 모니터링해야 합니다.
10여 년 전 빅 데이터 분석 기술이 부상하면서 새로운 윤리적 질문과 논쟁이 제기되었습니다. 새로운 분석 도구를 통해 사람들이 공개하지도, 공개되기를 원하지도 않는 개인 정보 및 민감한 정보를 유추할 수 있게 되었기 때문입니다. 기업은 이와 같이 민감한 정보를 추출할 수 있는 기술을 어떻게 다뤄야만 할까요?
데이터 분석 기술을 강화할 수 있는 잠재력을 지닌 생성형 AI는 새로운 윤리적 문제를 제기하는 한편, 오래된 윤리적 문제 또한 재조명하고 있습니다.
미군부터 코카콜라에 이르기까지, 광범위한 규모 및 분야의 기관 및 기업들이 생성형 AI의 활용법을 시험하는 중입니다. 다음은 해당 기술의 광범위한 잠재력 및 신속한 도입 현황을 나타내는 몇 가지 사례입니다.
Snapchat의 개발사인 Snap Inc.는 OpenAI의 GPT 기술에 기반한 'My AI'라는 챗봇을 출시했습니다. Snapchat의 어조와 스타일에 맞춰 최적화된 My AI는 친근하고 매력적인 대화 상대로 프로그래밍되었습니다. 사용자들은 자기만의 아바타, 배경화면, 이름 등을 사용하여 챗봇을 커스터마이징할 수 있고, Snapchat 사용자들이 평소 친구들과 소통하는 것과 같은 방식으로 일대일 채팅 또는 다른 사용자들과의 그룹 채팅에 자기만의 챗봇을 활용할 수 있습니다. 사용자는 챗봇에게 개인적인 조언을 요청하거나 음식, 취미, 음악 등을 주제로 일상적인 대화를 나눌 수 있고, 심지어 챗봇의 농담도 들을 수 있습니다. Snapchat은 사용자들이 증강현실 렌즈와 같은 Snapchat 앱의 기능을 사용해 보도록 유도하고, 지도상에서 가 볼 만한 장소를 추천받는 것과 같이 Snapchat을 통해 검색하는 일은 많지 않았던 종류의 정보 검색도 지원할 수 있도록 My AI를 조정해 두었습니다.
Bloomberg는 BloombergGPT를 발표했습니다. BloombergGPT는 약 절반은 일반적인 데이터, 나머지 절반은 Bloomberg의 독점 데이터 및 정제된 금융 데이터를 사용하여 학습한 챗봇입니다. 기사 헤드라인 작성과 같은 간단한 작업은 물론, 영어 평서문으로 작성된 프롬프트를 수많은 금융사들의 필수 도구인 Bloomberg 데이터 단말기 사용에 필요한 Bloomberg Query Language로 전환하는 것과 같이 고유한 작업도 수행 가능합니다.
Oracle은 AI 기업인 Cohere와 파트너십을 체결했습니다. 양사는 기업별 데이터를 사용하여 미세 조정된 AI 모델 구축을 지원함으로써 전문화된 기업별 생성형 AI 도구의 사용을 촉진하기 위해 협력할 것입니다.
Oracle의 CTO인 Larry Ellison은 2023년 6월 실적 발표에서 금융업계의 애널리스트들을 향해 "Cohere와 Oracle은 기업 고객들이 개인 정보 침해 위험이 없는 데이터를 사용하여 자사의 용도에 특화된 대규모 언어 모델을 매우 간단히 학습시킬 수 있도록 지원하고자 협력하고 있습니다"라고 말했습니다. Oracle은 자사의 다양한 비즈니스 플랫폼에 생성형 AI 서비스를 내장하여 많은 기업들이 자체 모델을 처음부터 구축 및 학습시키지 않고도 자사의 기존 프로세스 전반에 AI 기술을 적용하여 생산성 및 효율성을 향상시킬 수 있도록 지원할 계획입니다. 같은 맥락에서 Oracle은 최근 자사의 인사 관리 소프트웨어인 Oracle Fusion Cloud Human Capital Management(HCM)에 생성형 AI 기능을 추가할 예정임을 발표하기도 했습니다.
다음은 생성형 AI의 추가적인 사용 사례입니다.
비록 ChatGPT가 최근 선풍적인 인기를 끌기는 했지만, 그 외에도 각 분야에 적합한 생성형 AI 도구들을 사용할 수 있습니다. Jasper, Lex, AI-Writer, Writer를 비롯한 다양한 도구들이 그것입니다. 현재 이미지 생성 분야에서는 Midjourney, Stable Diffusion, Dall-E가 가장 각광받고 있습니다.
수십 개에 달하는 작곡 AI 중에서는 AIVA, Soundful, Boomy, Amper, Dadabots, MuseNet가 가장 유명합니다. 소프트웨어 프로그래머들이 ChatGPT를 유용하게 활용하고 있다는 사실은 이미 잘 알려져 있지만, ChatGPT 외에도 Codex, codeStarter, Tabnine, PolyCoder, Cogram, CodeT5 등 코드 작성에 특화된 생성형 AI 도구들도 많이 있습니다.
놀랍게도 오늘날 사용되는 생성형 AI 모델의 역사는 1943년까지 거슬러올라갑니다. 1943년은 영국에서 제2차 세계대전 동안 암호화된 메시지를 해독하는 데 사용되었던, 최초의 프로그래밍 가능 전기 구동 컴퓨터인 Colossus가 세상에 처음으로 선보여진 해이기도 했습니다. 생성형 AI 개발의 첫 번째 단계는 바로 University of Illinois College of Medicine의 정신과 의사이자 교수인 Warren McCulloch과 컴퓨터 신경과학을 독학한 Walter Pitts가 공저한 '신경 활동에 내재된 아이디어의 논리적 계산(A Logical Calculus of Ideas Immanent in Nervous Activity)'이라는 연구 논문이었습니다.
수학 신동이었던 Pitts는 15세에 가출하여 노숙자 생활을 하던 중 McCulloch을 만났고, McCulloch은 Pitts를 자신의 가족으로 받아들여 함께 살게 되었습니다. Pitts는 인공 뉴런이 1을 출력할지 0을 출력할지 여부를 '결정'하기 위해 사용하는 기본 수학을 확립한 중요한 논문을 발표한 후 University of Chicago에서 학사 학위를 받았습니다. 이는 Pitts의 유일한 학위이기도 했습니다.
두 번째 단계는 뉴욕주 버팔로시에서 Cornell Aeronautical Laboratory의 연구 심리학자 Frank Rosenblatt에 의해 진행되었습니다. 1957년 7월 미국 해군 산하 해군연구청으로부터 Cornell의 Project PARA(Perceiving and Recognizing Automaton)와 관련된 연구를 수행한 Rosenblatt은 McCulloch와 Pitts의 논문을 바탕으로 입력 계층과 출력 계층 사이에 하나의 '숨겨진' 계층이 존재하는 신경망인 퍼셉트론(perceptron)을 개발했습니다. 현재 스미스소니언 협회에 보관되어 있는 Mark I Perceptron을 제작하기 전, Rosenblatt 과 해군은 1958년 7월에 있을 공개 시연을 위해 IBM 704 메인프레임 컴퓨터를 사용한 시뮬레이션을 실시했습니다. 그러나 퍼셉트론은 너무 단순한 신경망이었으며 Massachusetts Institute of Technology의 AI 연구소를 공동 설립한 컴퓨터 과학자 Marvin Minsky의 비판을 받기도 했습니다. Minsky와 Rosenblatt은 공개 포럼에서 퍼셉트론의 장기적인 전망에 대해 논쟁을 벌였고, 결과적으로 1960년대부터 1980년대까지 AI 커뮤니티는 신경망 연구를 거의 진행하지 않았습니다.
소위 'AI 겨울'로 불리는 기간이었습니다.
신경망 연구는 퍼셉트론을 재발견한 인물인 Paul Werbos를 비롯해 Geoffrey Hinton, Yoshua Bengio, Yann LeCun 등 많은 연구자들의 공헌에 힘입어 1980년대부터 해빙기를 맞이했습니다. 이들은 공동 연구를 통해 대규모 다층 신경망의 가능성을 입증했고, 해당 신경망이 역전파 알고리즘을 활용한 점수 부여를 통해 정답 및 오답을 학습할 수 있는 방법을 찾아냈습니다. RNN 및 CNN도 바로 이 시기에 등장했습니다. 그러나 초기 신경망 기술 및 80년대의 컴퓨팅 성능으로는 충족할 수 없었던 과도한 기대치는 이내 실망으로 바뀌며 신경망 연구는 다시금 소강 상태에 접어들었고, 1990년대 및 2000년대 초에 이르는 두 번째 AI 겨울이 찾아왔습니다.
그러나 두 번째 겨울 동안에는 Hinton, Bengio, LeCun을 비롯한 많은 신경망 연구자들이 계속해서 연구를 이어나갔습니다. 'AI의 대부'로도 불리는 이 세 사람은 1980년대의 연구 성과 및 그 이후로도 끈기있게 계속한 연구, AI 분야에 대한 오랜 공훈 등을 인정받아 2018 Turing Award를 공동 수상했습니다. 그리고 2010년대 중반부터는 상단의 '생성형 AI 모델' 섹션에 소개된 것과 같이 새롭고 다양한 신경망들이 속속 등장하기 시작했습니다.
생성형 AI가 기업의 성과와 업무 방식에 어떤 영향을 미칠지는 아직 미지수입니다. 하지만 한 가지 분명한 사실은 그간 인간이 수행해 왔던 다양한 작업을 생성형 AI를 활용하여 수행하기 위한 연구개발에 막대한 투자금이 쏟아져 들어오고 있다는 것입니다. 벤처 캐피털, 대기업, 그리고 그 사이 어딘가에 속하는 거의 모든 기업들이 생성형 AI 스타트업에 앞다투어 투자하고 있습니다. 그러한 투자를 가능케 한 것은 인간이 빅데이터와 상호작용할 수 있는 매개체 역할을 수행하며, 방대한 정보를 간단하고, 명확하고, 놀라울 만큼 빠르게 요약하여 사람들의 이해를 돕는 LLM의 마치 '마법'과도 같은 기묘한 능력입니다. 이는 생성형 AI가 기존의 다양한 애플리케이션에 내장되고, 새로운 AI 기반 애플리케이션들이 제2의 물결을 일으킬 것이라는 사실을 시사합니다.
예를 들어, Gartner는 2024년까지 엔터프라이즈 애플리케이션의 40%에 대화형 AI가 내장될 것이고, 2025년까지 30%의 기업이 AI 기반 개발 및 테스트 전략을 도입할 것이고, 2026년까지 1억 명 이상의 근로자들이 '로봇 동료(robocolleagues)'와 협업하게 될 것이라고 예측하였습니다.
물론, 생성형 AI의 위험 및 한계로 인해 이와 같은 기세가 꺾일 가능성도 있습니다. 기업별 특징을 학습시키기 위해 생성 모델을 미세 조정하는 것이 지나치게 어려운 과정이라는 평가를 받게 될 수도 있고, 계산 집약적인 생성형 AI 모델의 운용 비용이 너무 많이 들 수도 있고, 의도치 않은 영업 비밀 노출을 우려하는 기업이 많아질 수도 있습니다.
또는 모든 전망이 실현되더라도 현재 많은 이들이 예상하는 것보다는 느린 속도로 진행될 수도 있습니다. 예를 들자면, 인터넷이 세상에 처음 선보였을 때 사람들이 예측했던 일들도 결국 실현되기는 했습니다. 하지만 1세대 선구자들이 예상했던 것에 비해 10년이 더 소요되었습니다. 그 10년은 인터넷과 관련된 전망을 현실화하기 위해 필요한 인프라를 실제로 구축 또는 발명하고, 사람들이 인터넷이라는 새로운 매체의 가능성에 따라 각자의 행동 방식을 조정하는 데 필요한 시간이었습니다. 생성형 AI 또한 여러가지 의미에서 새로운 매체라고 할 수 있습니다.
생성형 AI 분야의 인플루언서들은 해당 기술의 비즈니스적 활용 방안에 대한 폭넓은 예측을 수행하고 있습니다.
Carnegie Mellon University(CMU) Tepper School of Business의 기업가정신 석좌교수이자 CMU Corporate Startup Lab의 공동 설립자이기도 한 벤처 캐피털리스트 Sean Ammirati는 "생성형 AI는 미래의 기업 구조 자체를 바꾸어 놓을 수도 있습니다"라고 말했습니다. 인터넷의 등장 이후 '디지털 네이티브' 기업들이 치고 나갈 수 있었던 것과 마찬가지로,미래에는 생성형 AI를 활용한 자동화를 바탕으로 구축된 기업이 주도권을 잡을 수도 있을 것이라고 Ammirati는 예측합니다.
"생성형 AI를 기반으로 구축된 기업들은 모든 작업을 자동화하는 것을 당연시할 것이므로, 수동으로 수행하던 작업을 중단하고 해당 작업을 자동화하는 방법을 배우는 과정 자체가 생략됩니다." Ammirati는 말했습니다. "지금까지의 기업과는 전혀 다른 종류의 기업이 생겨날 수도 있을 것입니다."
Oracle은 이미 오랫동안 인공지능을 활용한 기능을 개발하고 자사의 제품에 적용해 왔을 뿐만 아니라, 생성형 AI 관련 개발 및 활동 또한 주도하고 있습니다. Oracle Cloud Infrastructure(OCI)는 생성형 AI 분야를 선도하는 많은 기업들이 선택한 클라우드 서비스입니다. 차세대 클라우드 서비스인 OCI는 기업이 자사의 조직 구조 및 사업부별로 특화된 생성형 AI 모델을 구축, 배포할 수 있는 완전한 플랫폼을 제공합니다. Oracle의 Ellison은 Oracle만의 강점을 다음과 같이 설명하였습니다. "Oracle의 모든 클라우드 데이터센터는 고대역폭, 저지연, RDMA(원격 직접 메모리 액세스) 네트워크를 갖추고 있습니다. 대규모 언어 모델 학습에 필요한 대규모 GPU 클러스터를 구축하는 데 완벽하게 최적화된 네트워크입니다. Oracle의 Gen 2 클라우드는 생성형 AI 워크로드 실행을 위한 극도로 높은 성능 및 비용 절감 효과를 함께 제공합니다. 결과적으로 Oracle은 AI 개발을 주도하는 기업들에게 최고의 선택이 되었습니다."
또한 Oracle은 Cohere와의 파트너십을 통해 새로운 생성형 AI 클라우드 오퍼링을 탄생시켰습니다. "이 신규 서비스는 기업 고객의 학습 데이터에 포함된 개인 정보를 보호해 주므로, 고객사는 안심하고 보유 중인 데이터를 사용하여 고유한 대규모 언어 모델을 학습시킬 수 있습니다"라고 Ellison은 해당 오퍼링을 소개했습니다.
80년 전 한 10대 가출 청소년의 수학 공식에서 시작되었던 생성형 AI 기술은 작년 말 ChatGPT의 출시와 함께 전세계인의 눈길을 사로잡았습니다. 다양한 규모 및 업종의 수많은 기업들이 생성형 AI의 기능을 실험하고, 관련 투자를 진행하며 생성형 AI의 혁신이 급격히 가속화되고 있습니다. 그러나 생성형 AI는 인간의 업무 수행 능력과 삶의 질을 크게 향상시킬 수 있는 가능성과 함께 기존 일자리의 소멸, 나아가 극단적인 경우 인류의 멸종에 이르는 수많은 위험을 함께 품고 있는 기술입니다. 현 시점에서 우리가 확실히 알 수 있는 것은 생성형 AI라는 이름의 지니는 이미 요술램프 밖으로 빠져나왔고, 그 안으로 다시 들어가는 일은 없을 것이라는 사실 뿐입니다.
Oracle은 모던 데이터 플랫폼과 저렴하면서도 고성능의 AI 인프라를 함께 제공합니다. 나아가 Oracle의 강력한 AI 모델, 독보적인 데이터 보안성, 임베디드 AI 서비스 등을 통해서도 Oracle의 AI 오퍼링이 완전한 기업용 솔루션으로 구축되었다는 사실을 잘 알 수 있습니다.
생성형 AI 기술이란 무엇인가요?
생성형 AI 기술은 인간 두뇌의 작동 방식을 모방한 신경망 소프트웨어 아키텍처를 기반으로 합니다. 해당 신경망은 비교적 소량의 샘플에 방대한 양의 데이터를 입력하고, AI 모델이 특정 단어 시퀀스의 다음에 올 단어, 또는 다수의 문장으로 이루어진 시퀀스의 올바른 배열 순서와 같이 간단한 예측을 수행하도록 지시하는 방식으로 학습합니다. 인간 연구자들은 신경망이 도출한 대답의 정답 또는 오답 여부에 따라 가점 또는 감점 피드백을 입력하고, 신경망의 예측 정확도가 향상될 때까지 동일한 학습 과정을 반복합니다. 결과적으로 생성형 AI 기술은 학습용 데이터에 포함된 내용 및 해당 데이터에 기반하여 진행한 학습 결과를 바탕으로 사용자의 질문 및 기타 프롬프트에 마치 인간이 작성한 것처럼 느껴지는 응답을 출력합니다.
대표적인 생성형 AI로는 어떤 것들이 있나요?
현재 가장 잘 알려진 생성형 AI 모델은 다양한 주제로 마치 사람처럼 느껴지는 대화 및 작문을 수행할 수 있는 ChatGPT입니다. 그 외에도 이미지 생성 도구인 Midjourney 및 Dall-E를 비롯해 텍스트, 이미지, 비디오, 사운드 등 분야별로 특화된 다양한 생성형 AI 도구들이 있습니다.
생성형 AI와 기존 AI의 차이점은 무엇인가요?
생성형 AI는 기존 AI와 근본적으로 다른 기술이 아니고, 같은 기술적 스펙트럼의 서로 다른 지점에 존재할 뿐이라는 사실을 유의해야 합니다. 기존 AI 시스템은 일반적으로 신용카드 사기 탐지와 같이 특정한 작업만을 수행합니다. 반면 생성형 AI는 일반적으로 더 광범위한 작업을 수행하고, 새로운 콘텐츠를 생성할 수도 있습니다. 이러한 차이는 생성형 AI 도구가 기존 AI보다 더 크고 다양한 데이터세트를 학습하는 데서 기인합니다. 나아가 기존 AI는 일반적으로 지도 학습 기법을 통해 학습하는 반면, 생성형 AI는 비지도 학습 기법을 통해 학습하는 것 또한 차이를 만들어내는 요인입니다.
생성형 AI와 관련된 위험으로는 어떤 것들이 있나요?
현재 생성형 AI의 잠재적 위험성에 대한 큰 사회적 논쟁이 진행 중에 있습니다. 극단주의자들은 생성형 AI가 궁극적으로 인간을 멸종시킬 수도 있고, 또는 세상을 구할 수도 있는 기술이라고 주장합니다. 그보다 현실적인 시나리오는, 생성형 AI가 현존하는 직업들 중 다수를 없앨 수 있다는 것입니다. 기업은 생성형 AI가 자사의 업무 프로세스와 직무에 어떤 변화를 가져올지, 그리고 해당 기술의 사용이 의도치 않은 개인 정보나 민감한 정보의 누출, 저작권 침해 등을 발생시킬 가능성은 없는지 예의주시해야 합니다.
생성형 AI가 잘 수행하는 작업으로는 어떤 것들이 있나요?
생성형 AI는 인간과 협력하여 새로운 아이디어를 브레인스토밍하고, 직원들에게 현 직책과 밀접한 분야에 대한 교육을 제공하는 등의 작업에 적합합니다. 또한 비정형 데이터를 보다 빠르게 분석할 수 있는 좋은 도구이기도 합니다. 보다 일반적으로는 생산성 향상, 비용 절감, 고객 만족도 향상, 의사결정을 위한 보다 나은 정보 제공, 제품 개발 속도 가속화 등을 통해 기업 운영에 기여할 수 있는 잠재력이 있는 기술입니다.
생성형 AI가 수행하지 못하는 작업으로는 어떤 것들이 있나요?
생성형 AI는 학습 데이터에 포함되지 않았거나 학습 데이터를 바탕으로 추정할 수 없는, 전적으로 새로운 아이디어는 도출할 수 없습니다. 또한 인간의 개입 없이 단독으로 사용되어서는 안 됩니다. 생성형 AI에는 인적 감독이 필요하고 인간과 협업할 때 그 가능성을 가장 잘 발휘할 수 있습니다.
생성형 AI를 사용하는 산업으로는 어떤 것들이 있나요?
생성형 AI의 광범위한 가능성을 감안하면, 거의 모든 산업에서 생성형 AI를 유용하게 사용할 수 있을 것입니다.
생성형 AI는 직업의 미래에 어떤 영향을 미칠까요?
생성형 AI는 지식 노동, 근로자들이 서로 협력하고 혼자 또는 함께 사업적 결정을 수행하는 활동에 많은 영향을 미칠 것입니다. 적어도 지식 근로자들은 생성형 AI 도구 사용에 익숙해져야 할 것이고, 일부 직업은 사라질 것입니다. 그러나 역사적으로 생성형 AI와 관련하여 예상되는 것과 같은 수준의 기술적 변화는 언제나 없애는 것보다 더 많은 일자리를 창출하곤 했습니다.