챗GPT 빅 웨이브
김지현, 최재홍 지음 | 크레타
챗GPT 빅 웨이브
김지현, 최재홍 지음
크레타 / 2023년 5월 / 243쪽 / 18,000원
챗GPT가 앞당긴 AI의 흐름
챗GPT가 일으킬 빅 웨이브챗GPT 공개 이후 국내의 한 커뮤니티에서 “챗GPT를 써봤나?”라는 질문에 이미 23% 이상이 실제 사용하고 있다고 답변했다. 이는 매우 짧은 시간 안에 이루어진 사건이지만, 여전히 새로운 AI가 등장했다는 막연한 소식만 들은 사람들에게 ‘챗GPT’가 무엇이고, 어떤 의미가 있는지 설명 부탁한다.
→ 챗GPT는 불과 2개월 만에 1억 명도 넘는 사람들이 사용할 정도로 매우 빠른 속도로 사용자가 늘어나고 있다. 반면 챗GPT 이전에 나왔던 IT 기술인 메타버스와 NFT, 블록체인은 그렇지 않았다. 지금은 모두가 쓰고 있는 스마트폰도 이렇게 빠른 속도로 퍼지지 않았다. 왜 유독 챗GPT는 이토록 빠르게 확산했을까? 챗GPT는 대화를 말하는 ‘챗(chat)’과 AI 모델의 하나인 ‘GPT’의 합성어로, 대화형 인터페이스(CUI)로 쉽게 서비스를 이용할 수 있다는 점이 핵심이다.
‘GPT’는 새로운 AI 모델이며 이는 거대 언어 모델, 즉 LLM(Large Language Model)의 일종이다. 챗GPT에 사용된 LLM은 정식 명칭 ‘GPT-3.5’로 오픈AI가 만든 뛰어난 성능의 AI기술로 구현되었다. 쳇GPT는 접근성이 뛰어나 웹에서 가입만 하면 일반인 누구나 바로 사용할 수 있다. 게다가 사용 방법이 매우 쉬워 따로 배울 필요가 없고, 궁금한 게 있으면 현재 우리가 대화하는 것처럼 질문하면 된다. 그러면 챗GPT는 아주 정확하고 일목요연하게 답을 해준다. 이렇게 쉽고 간편하다 보니 빠른 속도로 확산한 것이다. 챗GPT를 간단히 정리하자면 ‘GPT-3.5라는 새로운 AI 모델을 기반으로 만들어진 대화형 서비스’라고 이해하면 된다.
AI의 터닝 포인트, 챗GPT의 엔진 LLM챗GPT를 생성 AI라고도 부르는데, 용어부터 생소할 독자들을 위해 설명 바란다. → 챗GPT는 말과 글을 만들어 내서 사용자가 쓸 수 있는 서비스다. 이런 서비스를 가리켜 무엇인가 만들어내는 ‘생성 AI’, 다른 표현으로는 ‘AGI(범용 인공지능) 서비스’, 초거대 AI라고 한다. 우리가 어떤 기술을 이해할 때 제일 중요한 건 용어에 대한 정의와 위계에 대한 구분인데, 챗GPT는 생성 AI이면서 대화형 UI를 지원하니 대화형 인터페이스로 이해하면 된다. GPU가 LLM을 가동하기 위해서는 엄청난 비용이 드는데, 이는 새로운 NPU(신경망 연산처리 장치), 즉 AI 반도체 칩셋(chipset)에 드는 비용이다. 그렇다 보니 컴퓨팅 리소스가 많이 들어 있어 아래 그림에서 보이는 4가지로 구분해야 한다.
챗GPT 외에도 많은 생성 AI 서비스가 있다. 챗GPT를 개발한 오픈AI가 텍스트로 이미지를 만들어 주는 ‘달리(DALL-E) 2’라는 서비스를 만들었고, AI 스타트업 기업이 만든 ‘스테빌리티(AI)’라는 이미지 생성 AI도 있다. 스테빌리티 AI는 ‘스테이블 디퓨전’이라는 LLM 엔진을 기반으로, 대화형 인터페이스를 통해 이미지를 생성하는 ‘드림 스튜디오’ 서비스를 런칭했는데, 이도 GPU를 많이 쓴다. 이외에도 여러 기업이 혁신을 더해 다양한 생성형 AI 서비스들을 런칭하고 있다. 알다시피 모바일의 시대도 하드웨어 스마트폰이 등장하고 나서 모바일 세상이 펼쳐졌다. 스마트폰에 API(두 소프트웨어 구성 요소가 서로 통신할 수 있게 하는 언어나 메시지 형식)와 SDK(소프트웨어 개발 키트)가 오픈되었기에 앱스토어가 런칭되고 수백만 개의 앱이 나왔듯, 생성형 AI 서비스도 그렇게 폭발적으로 증가할 것이다.
우리가 그간 접한 AI는 ‘아마존 고’나 테슬라 자율주행에서 보듯 특정 목적으로만 쓰였다. 그런데 챗GPT에 사용된 LLM 기술은 뭐든 다 해낼 것처럼 보인다. 비즈니스에 있어서 이들 AI의 가장 큰 차이점은 무엇이며, 우리 일상의 서비스에 적용하려면 기업들은 어떤 고민을 해야 할까? → AI는 사용 용도에 따라 ‘프런트 AI(Front AI)’와 ‘인더스트리얼 AI(Industrial AI)’로 구분된다. 인더스트리얼 AI는 특정 기업의 비즈니스 문제를 해결하는 데 최적화된 솔루션이다. 주로 자율주행이나 ‘아마존 고’ 등 그 외 여러 분야에 적용되어 있다. 얼굴을 인식한다거나 자율주행차를 더 고도화하는 데는 LLM이 필요하지 않다(단 메타의 SAM이라는 LLM은 AR에서 현실의 물체를 인식하는 데 활용하기 적합하게 개발되고 있다). 이런 형태의 AI를 내로우 AI(Narrow AI), ‘ANI(Artificial Narrow Intelligence)’라고 한다.
반면 ‘프런트 AI’는 일반 사용자가 쓸 수 있는 범용 AI다. 아마존의 알렉사나 구글 어시스턴트 등 과거 1세대 AI 어시스턴트로도 선보였으나 범용이라 부르기에는 조금 약했다. 테스크 오리엔트(Task Orient) 대화로, 특정한 목적과 용도로만 사용할 수 있는 AI였기 때문이다. 그만큼 기술이 범용적이지 않았다. 그러나 이제 새로운 LLM 기술이 나왔다. 이 LLM 기술은 1세대 AI 어시스턴트보다 더 많은 작업을 수행할 수 있다. 예로 다음과 같이 테슬라 자율주행차를 이용하는 동안 스케줄을 정리해 달라는 등의 명령을 내릴 수 있다. “오늘 오전 스케줄 확인해서 이동거리를 확인한 다음, 주의사항이 있거나 이동 중에 충전이 필요하면 알림 설정해 줘. 그리고 목적지 발렛파킹 여부 확인하고 주차가 어려우면 근처 주차장으로 안내하고, 주차장에서 목적지까지 도보 이동 확인해서 알려줘.”
이는 기존의 테슬라 자율주행에서는 할 수 없었던 기능이다. 물론 AI 어시스턴트 역시 솔루션을 제공하지만, LLM은 이를 훨씬 효과적으로 해낼 수 있다. 그리고 또 특정한 용도로만 쓰이는 게 아니라 다양하게 쓸 수 있다. 특정 주제로 대화를 나눌 수도 정보를 찾아줄 수도 있으며, 상품을 추천하고 감성적인 대화도 가능하다. 기존에 우리가 접했던 AI들은 주로 ‘인더스트리얼 AI’, 바꿔 말해 ANI다. 그런데 ‘뭐든지 척척 해내는’ 초거대 AI는 LLM 기술을 기반으로 만든 AGI다. 기업들은 이제 LLM 기술로 기존의 내로우 AI를 더 고도화하는 데 힘을 쓸 것인지, 아니면 기존의 AI는 그대로 고도화하고 LLM 기술을 기반으로 또 다른 형태의 서비스를 추가할 것인지 등의 고민을 해야 할 것이다.
초거대 AI, AGI 생태계 속 기업의 선택
AGI 생태계에서 움직이는 기업들챗GPT가 산업에는 과연 어떤 영향을 미칠까? 이들은 어떻게 움직이며, 이 흐름에서 어떤 기업이 울고 웃게 될까? 이와 더불어 해외 기업의 동향과 생태계 구성도 살펴봐야 한다. 지난 20년 동안 해외에서는 구글, 국내에서는 네이버가 검색시장을 독점했다고 해도 과언이 아니다. 여기에 더해 90% 이상의 글로벌 온라인 광고시장은 구글이 가져갈 정도다. 이런 시장구조 속에서 과연 챗GPT 때문에 검색시장이 무너질 것인지, 아니면 새로운 변화의 흐름이 생겨날지 궁금하다.
→ 반은 맞고 반은 틀리다. 컴퓨터가 나왔다고 해서 TV가 사라진 것은 아니지만 시청률이 줄었고, 모바일의 출현으로 컴퓨터 사용 시간이 줄었다. 또한 페이스북 같은 소셜 미디어가 등장하면서 카페나 블로그 커뮤니티 활동 시간이 줄었다. 기존의 것이 새로운 기술 탄생으로 인해서 완전히 사라지지 않았지만 사용량은 크게 줄었으니 반은 맞고 반은 틀렸다는 것이다.
챗GPT가 검색을 대체할 것이냐고 묻는다면 그럴 것 같지 않다고 답할 것이다. 챗GPT는 ‘대화형’이다. 대화를 통해 질문에 답을 구한다. 그 답은 일반적으로 의심 없이 받아들이게 되어 정보를 취득하는 과정이 즉각적이고 빠르다. 반면 검색은 특정한 정보를 찾기 위해 여러 페이지를 탐색하며 하나하나 곱씹으면서 생각하고, 다른 정보를 비교, 비판하며 탐구하는 방식이다. 사람과 대화할 때 특정 주제에 관해 상대방이 더 잘 알고 있다고 생각하면 의심 없이 바로 수용하지만, 사전을 찾을 때는 꼼꼼하게 읽으며 생각하는 것과 같다.
그런 것처럼 검색을 통해 비슷한 자료를 여러 개 찾아보는 것과 챗GPT 같은 대화형 인터페이스로 필요한 것만 물어보고 정보를 얻는 것은 차이가 있다. 그래서 검색은 검색대로 서비스를 이어갈 것이고, 챗GPT는 그것대로 새로운 시장을 만들어 갈 것이다. 마치 전문가에게 묻는 것과 사전을 보는 것이 서로 대체되는 것이 아니라 상호보완되는 것과 같다.
단 어떤 영역은 기존에 검색하던 습관을 대체하기도 할 것이다. 한 예로 수많은 개발자는 코딩하면서 방대한 자료를 찾아본다. 어떤 함수를 써야 하는지, 근거 데이터는 무엇인지 등을 검색하는데, 챗GPT를 이용하면 그럴 필요가 없어진다. 챗GPT가 코딩 함수 프로그래밍 프롬프트를 넣으면 알아서 제대로 대답해 줄 것이다. 그러면 사용자는 이게 진짜인지 아닌지 직접 돌려보고 적용해 보면 알게 된다. 그러므로 검색 사용량이 확 줄어들 것이다. 나 역시 원고를 쓸 때 예전에는 검색을 많이 사용했지만, 지금은 챗GPT에 물어본다. 물론 그대로 사용하진 않는다. 내가 쓰려는 부분에 대해 잘 알기에, 정리해 준 내용을 보면서 사용 여부를 먼저 판단한다. 그래서 검색 사용량이 줄었다.
그런데 가격 비교나 뉴스, 특정 주제와 관련한 것, 찾는 정보의 또 다른 의견이 필요할 때는 여전히 검색해 본다. 또 챗GPT가 답변한 것이 맞는지 점검하기 위해서도 검색을 한다. 이렇게 챗GPT는 검색을 완전 대체하진 못하지만 검색 사용 시간을 상당 부분 줄일 것이다. 또 과거에 검색으로 하지 않았던 행위를 챗GPT에서 하는, 일종의 새로운 영역이 크게 부각할 것이다.
챗GPT를 사용하면서 오히려 모든 걸 검증해야 하기 때문에 검색량이 더 늘 것이라는 게 개인적인 생각이다. 물론 결과는 예측하기 어렵다. 그리고 챗GPT 기술을 사용하는 기업에는 더 큰 기회가 될 것이라고 했는데, 챗GPT 발전으로 변화할 기업의 AGI 생태계가 궁금하다.
→ 챗GPT와 같은 초거대 AI 서비스 생태계를 알아야 한다면 AGI 생태계를 먼저 살펴봐야 한다. AGI의 생태계는 아래 그림에서처럼 크게 3가지 관점으로 나눠서 볼 수 있다. 맨 하단의 ‘컴퓨터 레이어’는 인프라를 말한다. 챗GPT 같은 서비스를 가동하기 위해서는 LLM이 필요한데, 이 LLM을 가동하려면 어마어마한 컴퓨터 자원이 있어야 한다. 그래서 GPU, NPU 또 메모리 반도체를 만드는 컴퓨터 인프라 안에 클라우드를 넣기도 한다. 왜냐하면 LLM이 단독으로는 버거우니 API를 호출하면서 다양한 컴퓨터 인프라를 쓰는 데 클라우드 자원이 필요하기 때문이다.
다음으로 ‘LLM’인데, 다른 표현으로 ‘SOTA(State Of The Art) LLM’이라고도 한다. 감히 넘볼 수 없는 최고 절정의 AI란 뜻이다. 현대 소수 기업만이 만들 수 있는 LLM이 필요한 기업들은 가져다 쓸 수밖에 없다. 클라우드 기반의 API를 호출하거나, LLM API를 호출해서 가져다 쓸 것이다. 그렇게 되면 얼마나 많은 서비스가 만들어지겠는가. 그런데 이 서비스 자체가 아니라 서비스를 만드는 엔진이 무엇보다 중요하다. 자동차에도 엔진이 제일 중요한 것처럼 엔진을 이런저런 서비스에 적용해 쓸 것이다. 그래서 기업 동향을 보려면 LLM을 중심으로 시장을 바라봐야 한다는 관점이다. 앞으로 LLM을 가진 기업이 승자가 될 것이다.
마지막으로 또 다른 관점은 ‘애플리케이션 중심으로 바라보는 시각’이다. 지금 우리나라 스마트폰만 봐도 누가 승자인지 바로 떠오를 것이다. 모바일 시장의 강자는 스마트폰을 만드는 제조사가 아니라 앱을 서비스하는 인터넷 기업이다. 카카오톡이나 페이스북, 인스타그램 등이 모바일에서 승자인 것처럼 AGI 시장에서도 결국 생성 AI를 활용해 서비스를 만드는 기업이 승자가 될 것이라는 관점이다. 그런 AGI 서비스 기업은 LLM을 직접 만들거나 잘 가져와 사용해야 할 것이다.
이렇게 3가지 관점으로 나누어서 AGI 생태계를 들여다봐야 한다. 우선 ‘컴퓨터 레이어’ 부분을 지배하고 있는 기업은 그래픽 칩 제조회사 ‘엔비디아’가 있고, 잘 알려지지 않았지만 구글 역시 엔비디아 GPU처럼 가동하기 위한 NPU를 가지고 있는데, 바로 TPU다. 구글의 TPU를 포함해 LLM 운영에 필요한 여러 NPU, 또 LLM 학습에 필요한 데이터를 저장하는 데 사용되는 메모리 반도체 칩셋 등이 모두 하드웨어 칩셋이며, 이런 칩셋을 만드는 하드웨어 제조업체도 컴퓨터 레이어에 속한 기업이다.
방대한 LLM을 가동하기 위해서는 LLM이 API를 호출해 다양한 컴퓨터 인프라를 끌어다 쓸 수 있도록 도와주는 클라우드 자원도 중요하다. 마이크로소프트가 현재 오픈AI의 GPT-3와 GPT-3.5 그리고 GPT-4를 가져와 API로 외부에 제공하고 있다. 또한 오픈 AI에 투자한 지분을 가지고 API를 호출하는 사업을 하고 있기 때문에 마이크로소프트도 중요한 역할을 하고 있다고 본다. 구글 역시 API를 공개해 생성 AI를 구글 클라우드에 제공하고 있다. 한국에서는 네이버의 하이퍼클로바가 클로바 스튜디오를 통해서 한국형 LLM API를 제공하고 있다.
다음으로 ‘LLM으로 자신들만의 서비스를 만드는 경쟁구도’를 살펴보면, SOTA LLM을 가지고 있는 대표적인 기업이 오픈AI다. 그 뒤로 스테빌리티 AI가 따르고 있고, 이어서 허깅 페이스, 앤트로픽 등 여러 군데가 있다. 물론 구글도 공개하지는 않았지만 ‘람다’와 ‘팜(PaLM)’이 있다. 한국에도 네이버의 ‘하이퍼클로바’, 카카오의 ‘코지피티’가 AGI 서비스의 미래를 준비하고 있으며, 뒤늦게 아마존도 타이탄, 메타는 람마와 샘을 개발했다. 포인트는 ‘한국형 LLM이 과연 존재감이 있을까’ 하는 문제다.
왜냐하면 LLM은 언어를 따지지 않기 때문이다. LLM 입장에서는 한국어, 영어, 일본어를 가리지 않고 모든 인간의 언어를 0과 1비트로 이해한다. 그러니 영어인지 한국어인지는 중요하지 않다. 각 국가에 있는 개별 로컬 LLM은 의미가 없다. LLM 하나가 전 세계를 커버할 수 있기 때문이다. 이 때문에 과연 한국형 LLM이 살아남을 수 있느냐는 의구심이 생긴다. 단 각 산업 영역별, 도메인별로 버티컬 LLM의 필요성이 제기될 수 있다. 거기에서 가능성을 찾아야 할 것이다. 또한 그런 LLM을 기업에서 잘 활용할 수 있도록 파인튜닝, 데이터 그라운딩 등을 하는 솔루션의 비즈니스 기회도 있을 것이다.
마지막으로 ‘애플리케이션 중심’으로 바라보는데, LLM이 필요한 기업들은 각자의 필요에 따라 가져와 활용하면 된다. 즉 SOTA LLM을 가져다 AGI 서비스로 부가가치를 최대한 극대화해서 만들면 된다. 국내의 대표적인 AI 콘텐츠 생성 플랫폼 ‘뤼튼’은 매출을 늘리는 경쟁력 있는 카피, 완성도 높은 문구를 생성해 준다. 비슷한 서비스로 미국의 ‘제스퍼’가 있는데 이들은 문서를 생성해 주는 서비스로 보고서나 마케팅 문구, 중고 물품을 올렸을 때 잘 팔리는 글 등을 생성해 준다.
뤼튼은 챗GPT API는 물론 국내의 하이퍼클로바와 여러 개의 LLM을 복합적으로 쓴다. 이외에도 동영상을 편집해서 생성해 주는 서비스 ‘런웨이’, 음성이나 음악을 들려주면 후반부 오디오를 생성하는 ‘오디오LM’이 있고, 이미지를 만들어 주는 서비스 ‘달리’ 등이 있다. 이런 서비스들을 AGI 앱이라고 부른다. 우리 국내에도 대표적인 ‘이루다’ 앱이 있다. 이루다도 초반에는 리트리벌 모델이라 LLM 엔진을 쓰지 않았지만 이제는 LLM을 도입했다.
챗GPT가 뒤바꾼 빅테크 기업의 경쟁구도
치열해지는 빅테크 기업 전쟁이제는 조금 더 구체적으로 어떤 산업 패러다임이 어떻게 변하고 어떤 비즈니스 모델들이 있는지 이야기를 나눠보려 한다. 먼저 챗GPT가 과연 우리에게 기회인지 위기인지에 따라서 산업 분야에 변화가 있을 텐데, 가열되는 AI 기술 전쟁에서 챗GPT는 기업들에게 어떤 의미를 줄까?