인공지능

[인공지능#4] ChatGPT

오뚜기정보 2023. 10. 22. 13:15

GPT의 등장: 파괴적 혁신과 챗GPT

<그림 > 파괴적 혁신과 챗GPT
출처: acodez
https://acodez.in/

OpenAI의 챗GPT로 우리에게 알려진 거대언어모델(LLM: Large Language Model)은 오래 전부터 연구되어 온 분야이다. 이미 1960년대 미국 MIT(매사추세츠 공과대학교)에서는 자연어처리가 가능한 챗봇인 엘리자(ELIZA)를 개발하였다. 엘리자는 상담 치료를 목적으로 만들어졌으며 간단한 규칙 기반으로 작동하였다. 우리나라에서는 2002년 사람들이 텍스트로 말을 걸면 대답하는 ‘심심이(SimSimi)’ 서비스가 출시된 바 있다. 그 이후 관련 기술의 비약적 발전이 이루어진 것은 2017년 구글이 발표한 논문에 소개된 트랜스포머(transformers) 모델과 어텐션(attention) 기법을 통해서이다. 현재는 OpenAI의 GPT4, LG EXAONE, 카카오 MinDALL-E과 같이 언어모델 외에도 음성모델, 영상모델 등 여러 모델이 결합된 멀티모달 모델이 출시되고 있다. 텍스트를 입력하면 이미지, 동영상, 음악 콘텐츠를 생성해 주는 인공지능 모델까지도 가능해진 시대이다.

일반적으로 기술은 S-곡선의 형태로 성장한다. 초기 도입기에는 기술에 대한 지식이 부족하고 수요자도 많지 않아 기술 발전이 느리지만, 그 시기를 지나 시장에서 활용되기 시작하면 기술이 급성장한다. 이후 기술의 이론적 한계에 도달하면 성장이 정체되는 성숙기에 이른다. 이때 동일하거나 혹은유사한 시장의 니즈를 기존기술과 다른 원리로 만족시켜주는 여러 후속기술들이 제안되는데, 이들 중 시장에서 선택된 일부 기술들이 새로운 S-곡선을 그리며 성장해 나간다. 이러한 후속기술을 우리는 파괴적 혁신(disruptive innovation)이라 부른다. 지금 우리는 거대언어모델 분야에서 기존의 기술을 대체할 여러 후속기술들의 등장을 경험하고 있다. 구글의 PaLM2, 마이크로소프트의 MT-NLG, 메타의 LLaMA, 아마존의 AlexaTM, 화웨이의 PanGu-Alpha, 바이두의 PLATO-3, 네이버의 HyperCLOVA, 카카오의 KoGPT, 엘지의 EXAONE 등 기업들은 각자 특화된 알고리즘으로 시장을 공략하고 있다.

이러한 파괴적 혁신 기술의 가장 큰 특징은 기존기술이 만족시키지 못했던 시장의 니즈를 만족시킨다는 점과 초기 성능이 기존기술보다 낮을 수 있다는 점이다. 예를 들어, 대화의 맥락을 이해하고 피드백을 통해 학습하는 기능, 명시적으로 학습하지 않은 언어에 대해서도 처리할 수 있는 기능 등은 기존 기술에서 구현하지 못하였으나 시장에서의 잠재성이 높은 기능이다. 또한 챗GPT가 현재는 완벽하지 못한 기술이지만 지속적인 투자를 통해 점진적 혁신이 지속될 수 있음을 시사한다. 지금도 성능향상을 목표로 거대언어모델의 규모는 더욱 커지고 있다. 반면 더 가벼운 언어모델을 만들려는 노력도 치열하다. 이 과정에서 오픈소스가 등장하며 기술 발전을 촉진하고 있다. 사전 학습된 언어모델에 분야의 특이성이 반영되도록 추가학습이 이루어진 전문분야 모델, 언어 외에도 이미지와 소리 등으로 의사소통하는 멀티모달 모델 등도 개발되고 있다. 어떤 기술이 미래를 지배할 주류기술이 될지는 모르겠지만, AI 언어모델, 더 나아가 생성형 AI 기술을 둘러싼 기업 간 경쟁이 치열하다. 투자가 확대되면 기술은 필연적으로 성장한다. 우리가 파괴적 혁신 기술로 최근의 대규모언어모델에 주목해야 하는 이유이다.

GPT의 확산: 기술수용모델와 챗GPT

챗GPT는 2022년 11월 30일 서비스를 출시한지 두 달 만에 월간활성사용자(MAU: Monthly Active Users) 수 1억 명에 도달했다. 동일한 사용자 수를 확보하는데 인스타그램은 2년 6개월, 틱톡은 9개월이 걸렸음을 고려할 때 이는 실로 놀라운 성과이다. 챗GPT의 빠른 확산은 다양한 관점에서 설명할 수 있다. 우선 챗GPT는 대표적인 범용기술(general purpose technology)이다. 범용기술이란 다양한 분야에 적용되어 기술혁신을 유발함으로써 경제에 근본적인 영향을 미칠 수 있는 기술을 의미한다. 컴퓨터, 인터넷, 전기 등이 대표적이다. 범용기술은 그 특성상 잠재시장의 규모가 클 수밖에 없기에 해당 기술을 채택하는 사용자의 규모도 빠르게 늘어났을 것이다. 실제 챗GPT는 금융, 교육, 의료, 법률, 개발 분야에 이르기까지 거의 모든 산업 영역에서 활용될 수 있을 것으로 기대된다. 이외에도 챗GPT가 정확하지 않은 정보에 대해 잘못된 답변을 그럴듯하게 말하는 환각현상이 사람들에게 재미의 요소로 작용했다는 해석도 있다.

무엇보다 챗GPT의 빠른 성장은 기술수용모델(TAM: Technology Acceptance Model) 관점에서 설명된다. 기술수용모델은 잠재 사용자들이 정보기술을 받아들이는 과정을 설명하고 궁극적으로는 해당 정보기술이 얼마나 빠르게 확산될지 예측하는 데 사용된다. 간단하지만 설명력이 높아 활용도가 높기에 후속 연구에서 여러 변형모델들이 제안되고 있다. 이 모델에 의하면, 잠재 사용자들은 신기술이 사용하기 용이하며 유용하다고 인지할 때 사용 의도가 높아지며 실제 사용할 확률도 높아진다. 재미있는 사실은 신기술이 사용하기 쉽다고 생각할수록 더 유용하다고 느끼게 된다는 점이다. 챗GPT의 경우 인터넷을 통해 누구나 쉽게 서비스를 경험할 수 있었으며 무료로 제공되었다. 질문을 던지면 답을 얻는 인터페이스 또한 매우 직관적이었기 때문에 디지털 기기에 익숙하지 않은 일반인들도 쉽게 원하는 테스트를 해 볼 수 있었다. 또한 방대한 정보를 토대로 마치 사람과 같이 자연스러운 문장을 구사하는 챗GPT의 지식수준과 대화역량능력을 사용자들은 인정하고 있다. 여러 한계가 존재하지만, 그 잠재성을 높이 사는 것이다.

GPT의 현재: 하이프사이클과 챗GPT

<그림 > AI의 하이프사이클(2022)
출처:Gartner
https://www.ml4devs.com/

거대언어모델의 발전 속도는 분명 놀랍다. 자연어처리기술은 인간처럼 지각, 사고, 행동하는 강 인공지능의 핵심기술이다. 거대언어모델의 발전으로 영화에서나 보던 인공 지능로봇의 구현에 우리는 또 한 걸음 성큼 다가간 듯하다. 거대언어모델은 챗GPT처럼 챗봇이 될 수도 있고, 빙(Bing)과 같은 검색도구가 될 수도 있다. 이처럼 다양한 작업에 적용될 수 있는 도구의 기초가 되기 때문에 파운데이션(foundation) 모델이라고 부른다.

미국의 정보기술 연구 및 자문 회사인 가트너(Gartner)의 발표자료에 의하면, 파운데이션 모델에 대한 대중의 기대는 2022년 최고조에 이르러 있다. 이는 신기술에 대한 대중의 기대가 어떻게 변화하는지를 설명하고자 가트너가 개발한 하이프사이클(Hype Cycle)에 표현되어 있다. 이 그래프에서 기술은 대중의 관심을 받기 시작하는 기술촉발단계(technology trigger), 대중의 관심이 최고조에 달하는 기대정점단계(peak of inflated expectations), 과도한 기대가 깨어지며 관심이 줄어드는 환멸단계(trough of disillusionment), 기술이 수익을 내는 사례가 늘어나며 일부 관심을 회복하는 계몽단계(slope of enlightenment), 마지막으로 기술이 시장에서 성과를 내기 시작하며 자리를 잡는 생산성안정단계(plateau of productivity)로 이동하며 성장한다.

거대언어모델에 대해서도 과도하게 부풀려진 대중이 기대가 이제는 서서히 사그라질 시점이 다가온다. 우리는 지난 몇 개월간 다양한 실험을 통해 챗GPT의 가능성과 한계를 경험해 왔다. 챗GPT를 포함한 생성형 AI 기술이 지식노동자를 대체하리라는 기대는 이들의 생산성을 높여주는 도구의 역할을 하리라는 기대 정도로 다소 약화 되었다. 실제 챗GPT가 처음 출시되었던 시점에서의 낙관적인 기대와 달리 최근 기사들에서는 그 한계와 이슈에 대한 언급도 이어지고 있다. 예를 들어, 인터넷상에 존재하는 불분명한 정보를 그대로 학습하는 것도 문제이며, 학습에 사용되는 데이터의 저작권 이슈도 존재한다. 학습에 매우 많은 시간과 비용이 소요되며, 특정 회사의 거대언어모델을 사업에 활용할 경우 그 회사에 사업적, 기술적으로 종속될 위험도 있다.

무엇보다 전문가들은 현실을 이해하는데 필요한 비언어적 지식, 즉 상식과 논리가 부족하다는 점을 거대언어모델의 본질적 한계로 지적하고 있다. 챗GPT가 어떠한 개념을 정확하게 이해하고 설명하는 게 아니기 때문이다. 최근에는 30년 경력의 미국 변호사가 법원에 제출하는 서류를 준비하는 과정에서 챗GPT가 창작한 가상의 판례를 그대로 활용함으로써 법원 청문회에 넘겨질 처지에 놓였다. 단순한 재미로 챗GPT를 활용하거나 마케팅 카피라이팅, 기사의 헤드라인 제작 등 정보의 정확도가 중요하지 않은 상황에서 챗GPT는 유용한 도구가 될 수 있다. 그러나 판례 검색과 같이 정확한 정보를 제공해야 하는 상황이라면 잘못된 정보의 제공이 심각한 결과를 초래할 수 있다. 이처럼 챗GPT는 방대한 지식을 요약해 제공하는 도구임에도 불구하고 아직은 그 결과물에 대한 신뢰성 판단이 사용자의 책임이다. 챗GPT보다 한층 성능이 향상된 GPT-4에서도 신뢰성 문제는 여전히 존재한다. 따라서 앞으로의 기술혁신은 거대언어모델을 포함한 생성형 AI에 대한 지나친 낙관보다 현실적으로 가치를 창출할 수 있는 사업영역을 중심으로 이루어질 것이다.

GPT의 미래: 캐즘을 넘어

신기술 확산 과정에서 개인의 행동을 설명하는 기술수용모형과 달리 혁신확산이론(diffusion of innovation)에서는 신기술 채택 시점에 따라 개인을 다섯 개의 집단으로 나누고 집단의 특성을 설명하고자 한다. 즉, 기술을 가장 먼저 받아들이는 집단인 혁신가(innovator, 전체시장의 2.5%), 조기채택자(early adopter, 전체시장의 13.5%), 전기다수(early majority, 전체시장의 34%), 후기다수(late majority, 전체시장의 34%), 지체자(laggards, 전체시장의 16%)로 나누어지는데, 각 집단은 신기술을 채택하는 목적과 성향이 서로 다르다.

특히 초기시장이라 할 수 있는 조기채택자와 주류시장에 접어들었다 할 수 있는 전기다수의 성향 차이는 다른 집단들보다 더욱 두드러진다. 조기채택자의 경우 혁신적 성향을 지닌 오피니언 리더들이 신기술의 용도를 적극적으로 발굴하여 제시하는 반면, 실용성을 중시하는 전기다수의 경우 신기술의 용도와 가치가 명확하게 인지되지 않고서는 해당 기술을 활용하려 하지 않는다. 그 결과 조기채택자와 전기다수 사이에서 수요의 하락 혹은 정체 현상이 관찰될 수 있는데, 이를 캐즘(chasm)이라 한다. 원래 지질학에서 사용되는 용어로 갈라진 틈을 의미한다. 초기시장에서는 기술적 우수성만으로도 잠재사용자를 매료시킬 수 있으나 주류시장에 진입하기 위해서는 기술이 적용되는 영역별로 확실하고 안정적인 용도를 제시해야 한다는 것이다. MD(mini-disk player), PDA는 캐즘을 극복하지 못해 시장에서 사라진 대표적인 제품이다.


<그림 > 챗GPT의 혁신확신이론, 캐즘
출처: email on acid
https://www.emailonacid.com/

챗GPT는 현재 초기시장에 위치하고 있다. 아직은 조기채택자들이 각 산업부문에서 혹은 개인 일상에서 이 서비스가 우리의 삶을 어떻게 바꿀 것인지를 적극적으로 발굴하여 제시해 주고 있다. 실제 지난 몇 달간 유튜브에 관련된 내용을 검색하면 챗GPT의 활용방안에 대한 다양한 소개 동영상을 찾아볼 수 있다. 향후 챗GPT가 본격적으로 주류시장에 진입하기 위해서는 캐즘에 대비해야 한다. 이를 위해, 거대언어모델이 갖는 환각을 줄이기 위한 방법, 스스로 그리고 지속적으로 학습하는 방법, 학습 시간과 비용을 감소시키기 위한 방법 등 제품이나 서비스의 결함에 덜 관대하며 가격에도 민감한 전기다수를 만족시키기 위한 기술개발 노력이 필요하다. 또한 대화와 검색을 넘어 실제 행동을 취할 수 있는 수준으로까지 기술이 발전해야 할 것이다. 단순히 가장 저렴한 마스크를 찾아 달라는 것이 아니라 해당 마스크를 특정 배송지로 배송해 달라는 명령까지를 수행해 주는 것처럼 말이다. 마지막으로 챗GPT는 여러 한계가 있음에도 불구하고 아이디어 도출이나 프로그램 작성 등 일부 영역에서는 생산성을 크게 높여줄 수 있을 것으로 기대된다. 기술적 우수성에 기반한 막연한 낙관이 아니라 일반 대중에게 줄 수 있는 기술적 효용에 대해 구체적으로 생각해 볼 시점이다