인공지능

[인공지능#3] 초거대AI

오뚜기정보 2023. 10. 22. 13:14

초거대 AI는 대용량 데이터를 스스로 학습해

인간처럼 종합적 추론이 가능한 차세대 인공지능 AI를 뜻합니다.

영화 어벤져스의 자비스, HER의 사만다처럼

사람과 구분이 되지 않을 정도로 자연스러운 것이 특징입니다.

 

 

그럼 기존 AI와 어떠한 차이가 있는 걸까요?

AI의 성능의 기준인 파라미터(변수)가

기존 AI에 비해 최소 수백 배 이상이 많습니다.

한 기업의 AI 모델을 예로 살펴보면

기존 AI의 파라미터는 수억 개의 파라미터를 가진 반면

초거대 AI 모델의 파라미터는 1750억 개로 그 차이가 명확하게 느껴지는데요.

엄청난 양의 파라미터를 통해 스스로 많은 정보를 학습하고 기억하며

인간의 뇌처럼 창의력을 발휘할 수 있다는 점이

기존 AI와의 큰 차이점으로 볼 수 있습니다.

 

 

초거대 AI는 우리가 가장 흔하게 인공지능을 접할 수 있는

대화형 챗봇을 사람처럼 더욱 자연스러운 응답이 가능하게 할 뿐만 아니라

생명과학 분야에서는 예측 진단, 생체의학 영상처리, 보건 모니터,

제조/에너지 분야에서는 공급망 최적화, 불량제품 추출, 에너지 예측 등

다양한 산업에서 신기술 및 혁신 서비스를 만들기 위해 많은 기업이 노력을 기울이고 있습니다.

특히, 그동안 사람만이 할 수 있는 고유 영역이라고 믿었던

시, 그림, 소설과 같은 예술 콘텐츠에도 활용되고 있다는 점이 주목할 만한 부분인 것 같습니다.

 

 

국내에서도 초거대 AI 서비스 상용화를 위해 다양한 기업에서 노력 중인데요.

네이버의 하이퍼클로바는 한국어 특화 초거대 AI 모델로

검색어 교정, 챗봇, 음성인식, 리뷰 요약 등

네이버 서비스 전반에 걸쳐 상용화가 이루어지고 있습니다.

LG 엑사원은 텍스트, 이미지 동시 학습 AI 모델로

이미지를 언어로, 언어를 이미지로 표현할 수 있는데

엑사원이 생성한 이미지 품질이 매우 뛰어나다는 것이 큰 차별점입니다.

향후 엑사원은 제조, 교육, 연구, 금융 등 다양한 분야에서 모두

상위 1% 수준의 전문가로 활용되는 것을 목표로 개발에 많은 노력을 기울이고 있습니다.

 

 

하지만, 초거대 AI도 우려되는 점이 있는데요!

엄청난 양의 데이터를 처리할 수 있는 전제조건이 필요하기에

초고성능 컴퓨팅, 자율지능 공존기술, 인프라 구축 비용 등

자본력에 따른 기술 격차가 발생할 수 있다는 점입니다.

 

 

초거대 AI 학습과 활용의 어려움

초거대 AI는 모델이 매우 크기 때문에 학습과 활용 면에서 여러 어려움이 있습니다. 파라미터가 많고 데이터양이 많기 때문에 학습시키는 데 시간과 비용이 엄청나게 많이 듭니다. 정확하게 추산할 수는 없지만 GPT-3를 학습시키는 데만 대략 150억~340억 원 정도가 소요된 것으로 추정됩니다. 부가적으로 드는 비용(데이터 수집, 생성 등)은 계산하기도 어렵죠. 또 다른 예로 GPT-3 수준의 오픈소스 언어 모델인 블룸(Bloom)을 학습시키는데 nVidia A100 GPU 384개를 이용하여 3개월 동안 수행해야 했고, 학습된 모델을 수행시키는데 A100 GPU 8개가 장착된 전용 하드웨어가 필요했다고 합니다.

또 초거대 AI 학습을 시키기 위해선 엄청난 양의 데이터가 필요한데요. 네이버의 하이퍼클로바(HyperCLOVA)는 학습을 위해 5,600억 토큰(token·말뭉치)의 한국어 대용량 데이터를 구축했는데 이는 한국어 위키피디아의 2,900배, 뉴스 50년 치, 블로그 9년 치에 달하는 규모입니다. 이러한 데이터를 구축하는 것은 작은 회사들은 생각조차 할 수 없죠. 이러한 국내의 빅테크 기업도 개발에 필요한 슈퍼컴퓨팅 인프라가 국내에 없기 때문에 구글이나 NVIDIA와 같은 해외 기업과 협력하고 개발을 진행하고 있습니다.

결과적으로 초거대 AI 산업은 다양한 서비스를 하는 회사나 리소스를 충분히 갖춘 빅테크 기업들만 시도할 수 있습니다.

실제로 ChatGPT와 유사한 기능을 할 수 있는 PaLM + RLHF를 오픈소스로 GitHub에 공개하였지만 활용하기는 쉽지 않습니다. Pre-Trained 모델이 아니기 때문에 동작하기 위해선 필요한 데이터를 직접 사용자가 수집 및 가공을 해야 하고 학습에 필요한 컴퓨팅 자원을 확보해야 하기 때문입니다.


앞으로

상황이 이렇다보니 결국 자금력과 데이터를 갖춘 회사와 그렇지 못한 회사 간의 경계가 될 수 있고 초거대 AI 서비스를 하는 회사들은 이를 통해 수집한 데이터를 사용하여 경쟁사보다 부당한 이점을 얻을 수 있다는 우려도 나옵니다.

하나의 예로 OpenAI도 AI가 인류에 공헌할 수 있도록 만든 비영리 단체였는데 자본을 유치하기 위해 Capped Profit(제한된 이익법인)으로 변경하였습니다. 변경을 결정한 근거로 향후 몇 년 동안 대규모 클라우드 컴퓨팅, 인력 유치, AI 슈퍼컴퓨터 구축에 투자가 필요하다고 설명합니다. OpenAI는 2019년 7월에 Microsoft와 파트너십을 체결하고 10억 달러(1조 원)를 투자받습니다. Microsoft의 클라우드 서비스 Azure가 가진 강력한 클라우드 컴퓨팅 파워를 통해 GPT-3와 같은 인공지능 플랫폼을 개발하고 구현할 수 있게 되었습니다. 이러한 지원의 대가로 OpenAI는 Microsoft에게 자사의 인공지능 플랫폼을 비롯한 인공지능 분야의 기술을 제공하고 특히 GPT-3 언어 모델의 독점 라이센스를 Microsoft가 확보하게 됩니다. (Microsoft는 ChatGPT 기반의 ‘빙(Bing)’ 검색 엔진을 출시할 예정이라고 여러 소식지를 통해 기사화되고 있는 상황입니다.) 나아가서 Microsofts는 Visual Studio Code를 가지고 있고 GitHub도 인수했죠. 미래를 예측할 순 없지만 단순히 이렇게만 보더라도 Microsoft라는 빅테크 기업은 인류에게 공헌, 기여라는 목적보다는 서비스 선점(?) 혹은 독점을 위해 뛰어가고 있는 것 같습니다. 

또 다른 문제는 저작권, 라이센스 문제가 있습니다. DALL·E 나 Midjourney와 같은 AI로 이미지를 생성하는 업체들은 법적으로 아무런 문제가 없다고 말하고 있지만 AI가 학습한 데이터는 분명 저작권이 있는 이미지가 포함되어 있습니다. 그렇기 때문에 일부 예술 단체에서는 AI로 생성한 이미지의 업로드와 판매를 금지하거나 유사한 조처를 하고 있습니다. 그리고 Open AI에서 개발자에게 실시간으로 코드를 제안하는 Codex나 Copilot 같은 경우는 Github의 오픈소스를 이용하여 학습하였는데 오픈소스 라이선스를 고려하지 않고 모두 학습을 시켰고 일부 개발자들은 이에 집단소송을 하거나 향후 법적 분쟁에 대비하여 AI 제안 코드 사용을 금지하는 프로젝트도 있습니다. 이 때문에 GitHub를 떠나는 사람들도 생겨났는데 사실 이러한 문제가 오픈소스 생태계에 어떠한 영향을 미칠지 좀 더 두고 봐야 할 것 같습니다.

초거대 AI를 이용한 서비스는 이제 시작한 영역이고 아직 해결해야 할 문제가 많이 있습니다. 지속적으로 관심을 두고 지켜볼 필요가 있습니다. 

 

 

[뉴스 기사 거리]

 

초거대AI 공공분야 활용, 선적용·후개선 필요"
"초거대AI와 클라우드는 한 몸...클라우드 정책까지 고려해야"

컴퓨팅입력 :2023/04/17 15:59    수정: 2023/04/17 16:56


김미정 기자 기자 페이지 구독 기자의 다른기사 보기



정부와 기업이 협력해 초거대 인공지능(AI) 기술을 공공분야에 도입할 방법을 논의했다. 정부와 기업은 초거대AI를 가장 쉽게 적용할 수 있는 분야부터 시작해 AI 기능을 개선하면서 적용 분야를 확장할 방침이다.

국회 신상정포럼회는 17일 국회의원회관에서 '공공행정 AI 도입방안 모색 포럼'을 개최하고 민간 초거대 AI를 공공 분야에 효과적으로 적용할 수 있는 방안을 공유했다. 포럼에는 과학기술정보통신부 엄열 AI기반정책관, 행정안전부 황규철 공공지능정책관, 네이버 하정우 AI랩 소장, SKT 신용식 부사장 등 정부·기업 관계자가 토론패널로 참석했다.

"초거대AI, 행정업무·민원 처리 서비스에 우선 적용"


과기정통부 엄열 AI기반정책관 (사진=지디넷코리아)
과기정통부 엄열 AI기반정책관은 올해부터 민간 초거대AI 기반 서비스를 공공 분야에 본격 도입하도록 지원하겠다고 밝혔다. 가장 먼저 내부 행정업무와 민원 처리 서비스에 활용한다.

정부는 초거대 언어모델을 행정 보도자료, 홍보문구 생성에 적용할 방침이다. 일반적으로 공무원들은 새로운 정책 추진에 대한 보도자료를 작성해 배포한다. 이에 드는 시간이 오래 들뿐더러 이에 따라 다른 중요한 업무에 집중하기 힘들었다.

엄열 AI기반정책관은 "민간 초거대AI 서비스를 공무원 업무에 활용해 정부 생산성을 높이겠다"며 "단순 업무는 줄이고 중요 분야에 인력을 집중 배치하겠다"고 강조했다.

정부는 초거대AI 모델을 민원 처리 서비스에도 도입할 방침이다. 엄 정책관은 "기존에는 챗봇이 있어도 생성형이 아닌 준비된 답변만 제공했다"며 "초거대AI를 접목해 질문 자체를 이해하고 답변을 생성할 수 있는 챗봇으로 기능을 업그레이드하겠다"고 밝혔다.


행정안전부 황규철 공공지능정책관 (사진=지디넷코리아)
디지털캠프광고로고
4781
행정안전부 황규철 공공지능정책관은 초거대AI를 공공분야에 도입할 때 고려해야 할 사안에 대해 말했다.

황규철 공공지능정책관은 "신뢰성과 정확성에 대한 문제 위험성이 적은 분야에 AI 모델을 우선 적용해야 한다"고 강조했다. 보고서 작성이나 자료검색 등 공무원 내부 업무에 안전하게 적용할 수 있는 곳부터 공략하겠다는 방침이다.

그는 "챗GPT처럼 언어모델은 100% 맞는 답변을 낼 수 없다"며 "먼저 정부 내부에서 오류를 바로 수정할 수 있는 분야에 배치해 기능을 올리고 오류를 바로잡겠다"고 말했다. 공무원 내부 업무에서 충분한 실증을 거친 후 점진적으로 다른 공공분야로 확대하는 식이다.

그는 "AI를 공공에 적용할 때는 많은 구축 비용이 든다"며 "민간과 협업해 효율적인 방식으로 적용 분야 확대에 노력하겠다"고 말했다. 구현에 필요한 기능, 비용, 보안, 기술 발전 속도 등을 종합적으로 고려해 민간 초거대AI를 공공에 확장 적용할 셈이다.

그는 AI 모델에 들어갈 학습데이터 구축방안도 고려해야 한다고 강조했다. 그는 "데이터는 개인정보 관련한 이슈를 모두 제거한 후 활용해야 한다"며 "이를 통해 AI 성능을 끌어올릴 수 있는 데이터 학습 방법을 논의해야 한다"고 말했다.

"초거대AI와 클라우드는 한 몸...공동 성장 전략 필요"


네이버 하정우 AI랩 소장 (사진=지디넷코리아)
네이버 하정우 AI랩 소장은 초거대AI뿐 아니라 클라우드 정책 개선도 필요하다고 주장했다. 하정우 소장은 "오픈AI가 마이크로소프트와 협업하기 시작했고, 최근 아마존웹서비스도 초거대AI 대열에 합류했다"며 "초거대AI와 클라우드는 함께 성장하는 분야다"고 강조했다.

하 소장은 "정부는 초거대AI뿐 아니라 국내 클라우드 기업이 성장할 수 있는 전략도 마련해야 한다"고 했다. 국내 클라우드 기업을 보호해야 한다는 의미다. 그는 "특히 초거대AI 활용을 위한 망 정책을 추가해야 한다"고 했다. 그는 향후 누구나 비용 부담 없이 초거대AI를 활용할 수 있도록 정부 예산 편성도 더 늘려야 한다고 덧붙였다.

 

뉴스 퍼옴