AI 예감
권기대 지음 | 베가북스
AI 예감
권기대 지음
베가북스 / 2024년 6월 / 384쪽 / 23,000원
[PART ONE] 생성 AI 혁명 2년째 무엇이 달라지고 있는가
백가쟁명을 방불케 하는 거대언어모델 LLM
[오픈AI, 챗GPT 혁명 그 이후]오픈AI가 2022년에 출시한 GPT는 그 기반 모델이 매개변수 1,750억 개의 GPT-3.5였다. 이어 반년도 채 지나지 않은 2023년 3월에는 1조 개의 매개변수와 45GB의 훈련 데이터 세트로 학습시킨 GPT-4 버전을 공개했다. 그와 동시에 기업용 챗GPT를 출시하며 수익화에 나섰고, 여기에 이미지 생성 AI 달리 3을 통합하기도 했다. 뒤이어 이를 한층 더 개선해 내놓은 ‘GPT-4 Turbo(터보)’ 모델은 현존하는 LLM 중 최고의 성능을 자랑한다. GPT-4T의 구동 비용은 GPT-4에 비해 60% 이상 저렴해졌고, 2023년 4월까지의 최신 데이터를 다룰 뿐 아니라, 최대 300페이지 분량의 텍스트를 단번에 처리할 수 있다. GPT-4T의 또 다른 특징은 문자뿐만 아니라 이미지까지 이해하는 멀티모델 기능이다.
이 책이 인쇄에 들어가기 직전 뉴스에 의하면, 오픈AI는 보고 듣고 말하는 새로운 AI 모델 ‘GPT-4o(GPT-포오)’를 공개하고 시연했다. 이는 주로 텍스트를 통해 대화하던 기존 모델과 달리 이용자와 실시간 음성으로 질문하고 답변을 요청할 수 있는 AI 모델이다. 오픈AI는 GPT-4o가 50개 언어에 대한 GPT의 품질과 속도를 향상했으며, 불과 6개월 전에 내놓은 GPT-4T보다 두 배 빠르고 비용은 2분의 1 수준이라고 한다.
GPT-5, 스스로 진화하는 Al: 지금 AI 업계는 GPT-5를 학수고대하고 있다. 매개변수가 GPT4의 100배 이상인 125조 개에 달한다는 차세대 파운데이션 모델 GPT-5는 2024년 하반기 발표될 것으로 보인다. 일부 전문가들은 GPT-5가 추론 및 계획의 기능까지 갖춤으로써 인간 수준의 AGI(Artificial General Intelligence; 인공 일반 지능)에 도달할 것이라고 평하기도 한다.
전 세계에 챗GPT 열풍을 일으킨 오픈AI는 2023년 Al 생태계의 최상위 포식자였다. 오픈AI의 승승장구는 곧 MS의 승리다. 일찌감치 오픈 AI에 130억 달러라는 대규모 투자를 단행했고 그 결실을 함께 누리고 있기 때문이다. MS는 오픈AI의 파운데이션 모델인 GPT 시리즈를 MS의 자체 서비스에 모두 적용하고 있다. 치열하게 전개 중인 AI 전쟁의 초반엔 일단 MS-오픈AI가 승기를 잡은 모양새다. 다만 2024년 이후에도 이런 독주가 이어질지는 모를 일이다. AI 비즈니스 모델이 워낙 다양한 데다 고만고만한 AI 서비스가 우후죽순처럼 쏟아지고 있기 때문이다. 구글과 손을 맞잡은 딥마인드도 주목의 대상이며, Anthropic(앤쓰로픽)만 하더라도 언제든지 오픈AI 자리를 위협할 수 있다.
[구글, ‘제미나이’로 생태계 일원화]챗GPT 혁명 1년 후 구글의 AI 전략은 ‘Gemini(제미나이)’ 생태계 확립이 뼈대를 이루는 것 같다. 챗GPT로 인해 상처 입은 원조 AI 기업의 자존심을 되찾겠다는 각오다. 급히 AI 챗봇 Bard(바드)를 출시하고, 추론과 코딩 능력을 강화한 PaLM2(팜2) 등 신형 LLM으로 반격했다. 인터넷 사용률이 높고 구글 검색의 강력한 경쟁자가 있는 시장을 먼저 겨냥해 한국어와 일어 서비스도 추가했다. 하지만 효과는 미미했다. 여전히 오픈AI만 못하다는 세간의 평가에 와신상담 반격의 카드로 꺼낸 것이 제미나이로, 범용 버전은 바드에 이미 적용됐다. 매개변수 크기에 따라 울트라, 프로, 나노의 3개 모델로 나뉜다. 최상위 모델 울트라는 매개변수가 1조 5,600억 개로, 현재 업계에서 가장 앞섰다는 오픈AI의 최상위 모델 GPT-4에 필적하는 수준이다.
GPT-4 대항마로 출시한 제미나이는 새로운 범용 LLM인데, 설계단계부터 멀티모덜(multimodal: 복합정보처리) 기능을 지향한 첫 모델이다. 모바일 기기부터 전문 데이터센터까지 모든 환경에서 텍스트, 이미지, 오디오, 동영상, 코드 등 다양한 ‘모드’의 정보를 효율적으로 처리한다. 40개 이상의 언어 구사는 물론이고, 무엇보다 추론, 이해, 창작 능력을 갖추었다는 게 가장 큰 특징이다. 이미지 인식의 수준을 넘어 대상의 속성과 특징까지 파악·추론하고 수학 문제까지 척척 풀어낸다. 가령 사과와 쿠키 이미지를 보면 ‘쿠키보다는 사과가 건강에 더 좋다’는 판단까지 한다. 코딩 성능도 훌륭해서 파이선, 자바, C++ 등의 프로그래밍 언어로 작성된 코드를 이해해 설명·생성한다. 코딩작업 성능을 평가하는 업계 표준 벤치마크에서 GPT-4를 능가했다. 또 제미나이 최상위 모델 ‘울트라’는 대규모 다중 작업 언어이해(MMLU) 능력 평가에서 GPT-4는 물론 인간 전문가까지 뛰어넘는 정답률 90%를 기록했다.
구글은 일반 사용자에다 개발자까지 아우르는 제미나이 지원 체계를 갖춰 챗GPT와 경쟁한다. 바드, 협업 소프트웨어 모음 Workspace(워크스페이스), 클라우드 내 Al 협업 툴 Duet Al(듀엣 Al) 등을 위시한 모든 AI 서비스 명칭을 제미나이로 통합해 제미나이 생태계를 확대한다는 계획이다. 그렇게 된다면 AI 업계 선두를 쟁취할 수도 있을 것이다. 스마트폰에서 쉽게 사용할 수 있는 제미나이 전용 애플리케이션도 출시했다. 제미나이는 멀티모덜 AI의 성과와 안전성에 따라 제조와 IT는 물론이고 의료, 교육 등 전 산업에 파급 효과를 미쳐 ‘생성 AI 2.0’ 시대를 불러올 수 있다.
구글(모회사 알파벳)은 검색시장의 왕자다. 검색은 광고 매출과 직결되어(구글 전체 매출에서 검색 광고 매출이 약 60% 차지) 있다. 그래서 검색 석권이 중요하고, MS 같은 경쟁자에게 검색 점유율을 뺏기는 것은 구글에 치명타다. 앞서 나간 MS-오픈AI 연합군에 AI 주도권을 내주면 구글의 비즈니스 모델 자체가 위태로워진다. 구글이 어디에서 어떻게 반전의 계기를 마련할지, 흥미로운 일이다.
언어모델의 치열한 다이어트: 맞춤형으로 진화하는 sLLM매개변수가 1,750억 개 수준이었던 챗GPT 이후 개발되어온 LLM들은 조 단위를 넘어선 방대한 규모를 자랑한다. 이에 비해 매개변수는 적어도 특정 분야에 최적화해 효율적으로 활용된다는 강점을 지닌 소규모언어모델(sLLM: small Large Language Model)의 활발한 개발이 눈에 띈다. ‘더 많이, 더 크게’를 외치던 AI 생태계에 경량화의 바람이 불고 있는 것이다. 국내 AI 스타트업 업스테이지가 개발한 sLLM ‘솔라’의 매개변수는 불과 107억 개, GPT-4와 비교하면 100분의 1 수준이다. 그 외에 세계 여러 국가에서 속속 등장하는 AI 모델들도 모두 ‘가벼운 몸집’의 경량 거대언어모델이다.
이들은 매개변수가 수백억 개에 불과한 ‘경량’ 언어모델이지만 컴퓨팅 리소스 요구사항이 적어서 효율성이 높은 데다, 훈련과 운영 비용도 적게 들어서 여러모로 잠재력이 상당하다. 특히 배포하기 쉬운 대안을 찾을 때 유용한 AI 모델이다. 그래서 모든 문제를 딱 한 가지 모델로 해결하겠다고 시도하는 대신, 당장 기업에 큰 부담이 안 되는 선에서 사용할 만한 소형 AI 모델들이 하나둘 빠르게 생겨나고 있다. 가령 만능 AI 대신에 수학 연산이나 프로그래밍 같은 어떤 분야에 특화된 AI가 환영받는 것이다. 이 같은 AI의 경량화 트렌드는 기기 자체에서 AI 연산을 처리하는 ‘온디바이스 AI’와 서로 궁합이 잘 맞아서 동전의 양면과 같다. 이는 AI 기술의 실용적 측면이 갈수록 두드러지는 과정인 동시에, 생성 AI의 대중화·일상화를 본격적으로 앞당기는 역할을 하고 있다.
일부 전문가들은 미래의 AI 시장이 인간을 대체할 수 있는 AGI 등 초거대 모델과 스타트업들이 제공하는 경량 모델로 크게 나뉠 거라고 한다. 물론 스타트업이나 중소기업뿐만 아니라 대기업들도 SLLM 만들기에 힘을 쏟고 있다. 구글의 야심작이라는 제미나이에도 역시 매개변수 32억 개인 소형 모델 ‘Gemini Nano(제미나이 나노)’가 포함되어 있어 온디바이스 AI 서비스에 활용된다.
국내에서도 활발한 맞춤형 SLLM 설루션: 국내에서는 카카오(주로 B2C 시장 타깃), KT(제조, 금융, 게임, 교육), 엔씨소프트(게임, 영상 콘텐트), 업스테이지(의료, 교육, 전자상거래), 코난테크놀로지(공공업무 효율화) 등이 작게는 매개변수 60억 개에서 크게는 700억 개 규모의 시장별 맞춤형 SLLM을 개발·제공하고 있다.
국내 AI 플랫폼 스타트업 올거나이즈는 고객사 특성에 맞춘 언어모델, 챗봇, 앱까지 한 번에 제공하는 올-인-원 설루션 ‘알리 앤서(Alli Answer)’를 개발했다. 고객사는 챗GPT, 제미나이, 클로바X 등 15종의 LLM을 원하는 대로 활용해 자신에게 적합한 ‘알리 앤서’를 만들 수 있다. 올거나이즈는 또 자신들이 직접 개발한 sLLM을 공급하기도 한다. 금융 분야에 특화된 ‘알리 파이낸스’ 같은 경량 Al 모델이 그런 예에 속한다.
클로드·미드저니 제친 우리 토종 AI 서비스: 2023년 말 글로벌 생성 AI 이용자 순위를 보면, 챗GPT, 제미나이, Character AI(캐릭터 Al)에 이어 국내 스타트업 아우름플래닛의 AI 서비스 ‘Liner(라이너)’가 4위를 차지했다. AI 챗봇 클로드(10위), AI 이미지 서비스 미드저니(14위) 등을 멀리 제쳤다. 그 외 네이버, 카카오 등 한국 기업의 이름은 50위 안에서 찾을 수 없었다.
원래 라이너는 웹페이지나 PDF 파일 등에서 마우스로 지정한 내용을 저장하는 하이라이트 서비스였다. 직장인들이 ‘컴퓨터 모니터 형광펜’이라 부르며 즐겨 사용했다. 이후 라이너는 AI 신기술을 활용해 AI 기반 업무 보조 시스템과 AI 웹브라우저 도구 등으로 쓰임새가 넓어졌다. 그리고 이런 확대가 사용자 증가로 이어졌다. 월간 라이너 방문은 7,000만 건에 육박하고, 90% 이상이 해외에서 이루어진다. 픽사와 넷플릭스 임직원들도 애용한다고 해서 화제가 되었다.
AI에 관한 한 후발주자인 한국은 앞으로도 AI 생태계의 변방에 머물러 있을 거라는 전문가들의 견해에도 불구하고 우리 기업들이 sLLM의 변화무쌍한 잠재력을 정확히 파악하고 영리하게 활용한다면, 한국도 AI 시대의 주역이 될 수 있다. 앞서나가는 학술적 이론이나 엄청난 돈과 시간을 요구하는 기초 모델 개발만이 능사는 아니기 때문이다.
네이버, ‘벌떼 전략’으로 AI 틈새시장 공략: 한국 시장에서 플랫폼 주도권을 가진 네이버는 글로벌 빅테크의 AI 공세에 대항해 자체 제작 LLM 하이퍼클로바X를 기반으로 신규 서비스를 거의 달마다 잇달아 선보이고 있다. 또 AI를 활용해 자사의 기존 서비스도 업그레이드함으로써 이용자 확보에 나서는 모습이다. 특히 B2B 서비스 분야에서 적극적인 시장 공략에 나선 것 같다. AI 서비스 제작 플랫폼에 하이퍼클로바X를 적용했고, 기업의 폐쇄망 안에서 생성 AI의 학습을 돕는 서비스를 내놓는가 하면, 기업용 협업 툴에도 LLM을 적용해 이메일 자동 생성, 회의록 요약 등 다양한 기능을 제공할 계획이다. 나아가 AI로 업그레이드한 새로운 검색 서비스 큐(cue)도 이미 정식 서비스를 시작했고, 특정 제품에 대해 질문하면 AI 챗봇이 적절한 카피를 제공하는 광고 플랫폼도 제공하는 등, 기존의 핵심 서비스에 AI를 융합하는 시도도 이어지고 있다.
해외 빅 테크의 거대한 투자와 전문인력 규모를 따라잡긴 어려운 네이버로서는 그들과의 차별화가 필요한 상황에서 한국어 특화 모델이나 자체 서비스 적용 등이 나름의 경쟁 전략이 될 수 있다.
기기 하나하나가 곧 AI 세상: 온디바이스 AI
[온 디바이스 AI, 내 손안의 인공지능]챗GPT 혁명이 시작된 지 1년여가 지난 지금, 생성 AI의 또 한 가지 두드러진 추세는 on-device(온디바이스) AI를 향한 움직임이다. 이는 각종 전자기기(디바이스) 자체에 고성능 AI가 탑재되어 있어서 굳이 인터넷과 연결되지 않아도 개인 맞춤형 서비스를 실시간으로 제공할 수 있는 기술을 가리킨다. 이제 훨씬 더 진화한 생성 AI가 탑재되면서 IT 기기들이 전례 없이 똑똑해졌다.
클라우드 중심의 기존 범용 AI 서비스는 온디바이스 AI 기술에 힘입어 맞춤형 서비스로 진화할 것이다. 디바이스 자체에서 AI 연산을 수행한다는 건 인터넷이나 클라우드 연결이 없어도 된다는 뜻이니, 전력 소모도 적고 데이터 보안도 더 튼튼해질 수 있다. 나만의 데이터를 안전하게 활용해 쓸 수 있으니 고도의 맞춤형 서비스가 가능하다. 이 같은 온디바이스 AI가 스마트홈 방식으로 구현되면, 사용자가 말하지 않더라도 모든 제품이 알아서 정보를 주고받고 작동하게 되지 않겠는가. AI가 우리의 삶을 빙 둘러싸는 ‘앰비언트(ambient)’ 환경이 이루어질 것이다.
[생성 AI를 품은 스마트폰]온디바이스 AI 시대의 도래를 가장 먼저 알려준 상징적 제품은 역시 삼성전자가 2024년 1월 출시한 소위 ‘AI 폰’ 아닐까. 이 프리미엄 스마트폰(갤럭시 S24 시리즈)에는 텍스트를 이미지로 바꿔주는 기능을 포함해 일찍이 스마트폰에서 볼 수 없었던 다양한 기능을 품은 온디바이스 AI가 탑재되었기 때문이다. 삼성으로선 애플과 구글이 굳건히 장악하고 있는 글로벌 모바일 시장 판도를 뒤흔들겠다는 출사표였다. 이젠 ‘스마트폰’이 아니라 ‘AI 폰’이다. 물론 흐름은 재빨리 확산됐고, 이제 경쟁사들도 하나같이 생성 AI를 스마트폰에 탑재하고 있다.
귀찮게 앱이 왜 필요해?: 현재 스마트폰 세계 1위는 어느 업체일까? 출하량으로는 삼성전자(점유율 20%), 매출액으로는 애플(43%)이다. 특히 프리미엄 스마트폰 시장에선 삼성이 ‘만년 2위’다. 왜 갤럭시는 이처럼 헐값 제품, 아이폰은 프리미엄 제품이 되었을까. 이유는 운영체제(OS)에 있다. 애플은 자체 운영체제인 iOS를 써서 기기에 최적화된 앱만 골라 탑재할 수 있어 프리미엄 전략이 통했다는 얘기다. 반면, 삼성은 세계 최고의 제조 능력을 갖추고도 구글의 OS를 빌려 쓰다 보니 뒤처진 것이다.
그렇다면 온디바이스라는 새로운 물결은 삼성전자가 이런 장애를 단번에 돌파할 ‘신비의 열쇠’일지 모른다. 사용자보다 사용자를 더 잘 알고 원하는 정보는 알아서 챙겨주는 AI 모델이 장착되어 있어서, 구글에의 의존도는 미미한 수준으로 뚝 떨어질 테니까. 아니, 이제 AI가 OS를 대체하는 게임 체인저가 되어, 지금의 모바일 생태계 자체를 뒤흔들어놓을 테니까. 아닌 게 아니라, 신형 AI 폰의 기능은 시장을 깜짝 놀라게 하기에 부족함이 없다. 아래 대표적인 기능 몇 가지만 봐도 그렇다.
실시간 통역-번역-요약: 해외여행이나 출장 등의 경우, 한국어로 말하면 AI가 곧장 통역을 해줘 외국인들과 실시간 대화를 가능하게 해준다. 또 녹음 앱에 STT(Speech-to-Text: 스피치를 텍스트로) 기술이 장착돼 있어, 회의나 강의를 녹음하면 말한 사람마다 음성을 분리해 스크립트를 만들어준다. 일종의 ‘Al 메모’ 기능이다. 미팅이나 강연 내용을 정리해야 할 때 유용할 것이다. 자체 AI를 이용하므로 별도 앱을 내려받을 필요도 없다. 그뿐인가, 변환한 텍스트를 앱 안에서 즉시 최대 13개 다른 언어로 번역까지 해준다. 심지어 MZ 세대나 알아들을 법한 “만·반·잘·부(Nice to meet you)” 등의 다양한 신조어까지 자연스럽게 번역한다. 또한 난이도 높은 과학 기사를 단 5초 만에 요약해주기도 한다.