AI 시대의 부의 지도
오순영 지음 | 메이트북스
AI 시대의 부의 지도
오순영 지음
메이트북스 / 2024년 5월 / 312쪽 / 19,800원
1부 지금은 AI 시대
제1장 AI가 세상을 움직이는 AI 시대를 산다
전 세계 뉴스 헤드라인을 점령한 챗GPT미국의 시사주간지 《타임》의 2023년 2월 27일 자는 챗GPT의 놀라움과 화제성을 대변해주듯, 챗GPT를 표지 인물로 선정했다. 그뿐만이 아니다. 2023년 12월 14일 자 과학 저널 《네이처》는 ‘네이처 10’에 처음으로 ‘인간이 아닌(non-human)’ 챗GPT를 인간들과 함께 선정했다.
《타임》의 표지 모델이 된 인공지능: 2023년 2월 27일 자 《타임》 표지에는 챗GPT와의 문답 내용이 실렸으며, 그 내용은 《타임》의 커버스토리 주제로 ‘The Al Arms Race Is Changing Everything(모든 것을 바꾸고 있는 AI 군비 경쟁)’에 대한 질문과 챗GPT의 답변이 마치 인터뷰의 한 부분처럼 실렸다. 그리고 인터뷰어인 기자 두 명의 이름 하단엔 ‘human’이라 표기했다.
2023년 상반기엔 하룻밤 자고 나면 새로운 Al 모델이 등장했고, 글로벌 빅테크의 새로운 뉴스들로 인터넷이 가득 채워졌다. 이때 각종 xxx-GPT라는 표현의 논문과 뉴스 기사들을 쉽게 접할 수 있었는데, xxx-GPT라는 이름을 가진 모델 중에서 여러 가지로 상징적인 GPT 2가지만 살펴보자. 하나는 글로벌 금융 기업인 블룸버그가 제시한 ‘블룸버그 GPT(BloombergGPT)’이며, 다른 하나는 국가 차원의 GPT를 구축하겠다고 나선 영국의 ‘브릿GPT(BritGPT)’이다. 이 두 GPT를 보면 AI가 국가와 산업을 모두 초월한 어젠다가 되고 있다는 것을 알 수 있다.
2023년 3월 30일 블룸버그는 방대한 금융 데이터로 훈련된 금융에 특화된 대규모 언어 모델인 블룸버그GPT를 소개하는 논문을 발표했다. 블룸버그GPT는 금융 뉴스, 회사의 재무제표 등 지난 40년간 수집한 블룸버그의 금융 관련 데이터를 활용해 대규모 훈련 데이터셋을 생성했으며, 이를 이용해 500억 개의 매개변수가 있는 언어 모델을 훈련했다. 현재는 내부에서만 활용되고 있으며, 그 성능은 기존에 공개된 모델보다 금융에 특화된 영역에 대해서는 훨씬 성능이 뛰어나다고 알려져 있다.
2023년 3월에 흥미로운 뉴스 헤드라인이 있었다. 그것은 바로 영국 정부가 브릿GPT를 위해 GPU 구매에 나선다는 뉴스였다. 내용인즉 국가 차원의 GPT가 있어야 하며, 챗GPT, 빙챗(Bing Chat) 및 구글의 바드(Bard)와 같은 서비스를 뒷받침하는 대규모 언어 모델에 대한 국가적 투자가 필요하며, 브릿GPT를 통해 국가안보와 경쟁력 확보를 해야 한다면서 정부 차원에서 브릿GPT를 언급한 것이다.
전통적인 AI 기술과 생성형 AI는 무엇이 다를까?기존의 AI 기술을 이야기할 때 늘 인용되는 이야기가 있다. 그것은 바로 개와 고양이를 구분하는 AI에 대한 이야기다. 개와 고양이의 사진을 문제와 정답의 형태로 잔뜩 학습시킨 후에 둘을 구분하도록 한다. 이것은 분류와 예측을 하는 기술이다. 데이터를 학습하고, 해당 데이터를 기반으로 결정 또는 예측하며, 사전에 입력된 정보에 따라 모든 패턴을 알고 이를 통해서 예측하고 이미 프로그래밍이 되어 있는 케이스들 중에서 동작하는 것이 과거의 전통적인 AI라고 할 수 있다.
반면에 생성형 AI는 일종의 콘텐츠를 새롭게 만들어내도록 설계된 AI 모델이라고 할 수 있다. 여기서 콘텐츠란 텍스트를 비롯해 이미지, 오디오, 비디오 등으로 AI 알고리즘을 통해 학습된 데이터셋으로, 혹은 이를 모방해 다양한 유형의 콘텐츠들을 새롭게 복제해내는 것이다. 그러한 이유로 생성적 AI는 음악, 미술, 소설 창작 등을 비롯해서 제품 디자인, 마케팅과 같은 창의적인 영역에 더욱 적합하며, 비즈니스에서도 비즈니스 프로세스를 개선하고 데이터 분석 성능을 향상시키는 등 기존의 AI 기술과는 다른 중요한 역할을 할 수 있게 되었다.
다만 생성형 AI의 기본이 되는 학습데이터들은 결국은 모두 과거 인간이 생성한 콘텐츠에 기반해 생성된다. 즉 생성형 AI의 창의적인 산출물들은 결국은 인간의 창의성에서 일종의 영감을 받아 만들어졌다고 할 수 있다. 우리가 가장 쉽게 접하는 뉴스 기사부터 다양한 학술적인 자료들과 이미지, 음성, 음악에 이르기까지 콘텐츠라고 부를 수 있는 모든 것들이 이에 해당할 것이다.
이런 특징 때문에 현재 생성형 AI는 기존에 빅데이터를 통해 학습된 텍스트, 이미지, 동영상 등의 지식 속에서 분석하고, 예측하는 등 답을 찾아내던 인공지능에서 좀 더 복잡도가 높은 지식 간의 연관 관계를 이해하고 요약하며 답을 찾아낼 수 있다. 뿐만 아니라 생성형 AI는 창의적인 영역까지 더해져서 사람처럼 느껴질 정도의 언어적인 지능과 다양한 멀티모달로 들어오는 정보들을 분석하고 해석하는 능력을 갖추고 있다. 마케팅, 기획, 전략, 비즈니스 관련 콘텐츠나 이메일 작성도 가능하며, 긴 글에 대한 요약문이나 제목 등을 작성하고, 소설, 시, 노랫말 등 창작도 가능하다. 다양한 프로그래밍 언어로 코딩할 수 있고, 텍스트 설명을 통해서 이미지와 동영상 등을 만들어내기도 하며, 이미지에 대한 질문을 분석하고 설명하는 것도 가능하다.
생성형 AI가 우리에게 던지는 시사점: 이러한 생성형 AI가 우리에게 던지는 시사점은 무엇일까? 첫째, 생성형 AI 모델들은 기본적으로 모두 이미 충분하게 많은 데이터로 학습된 초거대 Al 모델이다. 오픈 소스를 비롯해 국내외 빅테크 기업들이 다양한 API나 앱 형태로 기술을 제공함으로써 AI 관련 비즈니스를 할 때 AI 원천 기술에 대한 진입 장벽이 낮아졌으며, 이로써 AI 기술이 전체적으로 상향 평준화되는 계기가 되었다. 따라서 AI 기술 개발도 중요하지만 실제 활용 측면에서 어떤 차별화된 아이디어로 경쟁력을 가져갈 것인지가 더욱 중요해졌으며, 이제는 AI 기술의 우수함과 경쟁력을 비즈니스 가치로 실제로 증명해서 보여줄 시기가 되었다고 할 수 있다.
둘째, 이러한 AI 민주화로 인해 기술도 중요하지만 상대적으로 실제 활용하려는 기업 혹은 기관, 단체가 가지고 있는 고유한 데이터의 경쟁력이 더욱 중요해졌다. 데이터의 경쟁력이란 단순히 빅데이터, 즉 데이터의 양만을 의미하는 것이 아니다. 데이터의 양이 충분히 많다는 의미와 실제 활용 목적에 맞는 고품질의 데이터를 보유하고 있는지의 여부는 또 다른 문제이기 때문이다. AI 활용 목적에 맞는 적합성과 정확성을 가지는 데이터이면서 충분히 많은 데이터를 확보하고 수집하는 것이 바로 생성형 AI 기술 시대의 더욱 큰 경쟁력이 될 것이며, 해당 데이터들의 학습을 통해 최적의 성능을 만들어내는 파인튜닝의 노하우 역시 앞으로 더욱 중요해질 것이다.
셋째, 생성형 AI는 기존의 AI와 비교해 놀라운 성능과 무한한 가능성을 보여줬지만, 동시에 모델 크기가 크고, 활용하기 위해서 많은 학습 비용과 운영 비용이 예상되는 기술이기도 하다. 또한 알려진 모든 모델에는 보완해야 할 사항과 문제점들이 아직은 존재하며, 매일 새로운 논문과 관련 뉴스들이 넘쳐나고 있다. 즉 생성형 AI는 여전히 발전하고 있는 기술이며, 완성된 기술이 아니다. 따라서 시각을 다각화하고, 여러 협업 체계와 방법론을 시도해볼 필요가 있다.
제2장 챗GPT로 불붙은 AI 전쟁
국가 대항전이 된 초거대 AI우리는 초거대 AI와 생성형 AI, LLM(Large Language Model), 파운데이션 모델(Foundation Model) 등 다양한 용어로 챗GPT를 설명하고 있지만, 전체 맥락에서 보면 어떤 관점에서 무엇을 강조하고 싶은지에 따라 용어 선택이 다를 뿐이다. 초거대 AI는 과거 일반적으로 언급해온 AI 기술과 비교했을 때 대량의 데이터와 그에 대한 처리 능력을 기반으로 좀 더 복잡하고 범용적인 작업들을 수행할 수 있는 일종의 진화된 AI 기술로 충분히 많은 데이터를 통해 다양한 분야의 복잡한 문제들을 해결할 수 있는 범용성을 갖춘 AI가 바로 초거대 AI다. 챗GPT를 비롯한 GPT 모델들이 대표적인 초거대 AI이며, 국내에도 네이버 클라우드의 하이퍼클로바X, LG AI연구원의 엑사온, KT의 믿음 등이 이에 해당한다. 그런데 왜 갑자기 초거대 AI에 국가 대항전이란 이름이 붙게 되었을까? 그 배경은 크게 3가지로 이야기할 수 있다.
AI 기술의 숨 가쁜 속도전이 시작되었다 2022년 11월 말 챗 GPT 등장 이후 AI는 이제 놀라운 속도로 우리 일상으로 파고들고 있다.
AI와 인간의 공존을 위한 안전한 AI: 생성형 AI와 관련된 2023년 주요 뉴스들을 생각나는 것만 나열해도 과거 몇십 년 Al 역사와 비교했을 때 2023년이 얼마나 다이내믹한 해였는지 알 수 있다.
일론 머스크와 스티브 워즈니악 등이 AI 모델 개발을 6개월간 중단할 것을 요구했지만, 오히려 기업들은 더 빠르게 AI 시스템을 구축하려 했다. 결국 일론 머스크는 새로운 AI 회사인 XAI를 발표했고, 구글 직원들은 제미나이(Gemini) AI 모델을 준비했다.
2023년 11월에는 AI 안전정상회의가 열렸고, 오픈AI는 GPT-4 터보와 맞춤형 챗봇 서비스를 발표했다. GPT-4 터보는 비용 절감, 정확도 개선 등의 장점을 가지고 있다. 오픈AI는 강력한 자체 생태계를 구축했으며, GPTs 빌더를 통해 누구나 맞춤형 챗GPT를 만들 수 있게 되었다.
마이크로소프트는 내부에서의 챗GPT 사용을 금지했고, 오픈AI의 CEO 샘 올트먼은 이사회 결정으로 해고되었다가 다시 복귀했다. 생성형 AI는 매일 새로운 뉴스를 쏟아내며 전 세계의 관심을 끌고 있다.
한편에서는 생성형 AI에 대한 우려와 비판의 목소리도 나왔다. 특히 2023년 3월에는 일론 머스크를 비롯한 애플의 공동 창업자 스티브 워즈니악 등이 오픈AI가 원래의 목적을 벗어났다고 비판하면서 인간 수준의 지능과 경쟁할 수 있는 GPT-4보다 더 강력한 AI 모델의 개발을 6개월간 중단할 것을 요구했다. AI가 너무 빠르고 예측 불가능하게 발전해 수많은 일자리를 없애고, 허위정보를 범람시키며, 공황 상태로 인류를 파괴할 수 있다는 것이 그 이유였다.
그러나 기업들은 그 6개월 동안 오히려 더 빠르게 AI 시스템을 구축하려고 했다. 결정적으로 일론 머스크가 자신의 주장을 번복하는 데는 그리 오랜 시간이 걸리지 않았다. 2023년 7월 머스크는 오픈Al, 구글, 마이크로소프트와 경쟁할 새로운 AI 회사인 XAI를 발표했다. 또한 구글 직원들은 오픈AI의 GPT-4V에 필적하는 제미나이(Gemini)라는 AI 모델 출시를 준비했다.
2023년 상반기의 AI 모델 출시 주기를 보면 과연 가능할까 싶을 정도로 글로벌 빅테크들의 경쟁이 어마어마했다. 2023년 11월 단 한 달 동안의 타임라인 속 사건들만 봐도 생성형 AI를 비롯한 AI 산업이 어떻게 흘러갈지 쉽게 예상할 수 없을 정도이다.
제3장 생성형 AI의 가치사슬
새로운 플랫폼 경제를 만드는 생성형 AI챗GPT가 등장하기 전에는 AI 기술이 기업의 비즈니스가 존재하기 위한 일종의 코어엔진 기술이라고 인식되었다. 그러다가 생성형 AI가 등장한 이후 AI 기술은 일종의 인프라, 파운데이션으로 이해되기 시작했다.
오픈AI의 변화 시도: 우선 Al 모델의 사이즈에 ‘초거대’라는 단어를 쓸 정도로 그 모델 사이즈가 커지기도 했고, 특정 분야를 잘하는 AI 엔진이 아니라 범용적으로 활용이 가능할 수준으로 전반적인 성능 자체가 높아졌다. 언어 능력이 탁월하게 향상되고 계산이 빨라지다 보니 과거의 전기나 석유처럼 사업의 근간이 되는 인프라로서의 인식이 생겼다. 현재 생성형 AI 모델을 자체적으로 확보하려는 기업이나 이미 확보한 기업들은 어찌 보면 결국은 플랫폼 기업으로 변화하고자 하는 것이다. 자체 AI 모델을 서비스 형태로 다른 기업들에게 공급함으로써 활용 기업이 성장할 수 있는 기반 기술을 제공하는 것이다. 생성형 AI 기술을 가진 기술 기업이 플랫폼 기업이 되려는 움직임은 오픈AI를 통해서도 나타난다.
2023년 11월 오픈AI는 누구나 쉽게 맞춤형 챗GPT를 만들 수 있도록 하며, 이렇게 만든 챗봇을 판매할 수 있는 전용 스토어인 GPT 스토어를 구축하겠다고 발표했고, 2024년 1월 출시했다. 이것은 소비자 및 기업용 챗봇 시장을 주도하겠다는 의미였으며, 이는 애플의 앱 스토어와 같은 플랫폼경제를 구축하려는 전략이 엿보이는 부분이다.
생성형 AI를 기반으로 한 플랫폼 경제: 그러면 플랫폼이란 무엇이고, 플랫폼의 핵심은 무엇일까? 플랫폼은 기본적으로 구매자와 판매자가 반드시 존재해야 하며, 이들 간의 거래를 통해 가치를 만들어내는 비즈니스 모델이다. 아마존, 애플, 마이크로소프트, 유튜브, 우버, 에어비앤비 등은 모두 구매자와 판매자를 연결하는 생태계를 운영하고 이를 통해 엄청난 수익을 얻는다. 기존에 이미 형성되어 있는 플랫폼 경제를 이끌고 있는 플레이어들도 생성형 AI를 자신들의 플랫폼에 이식하고 발전시키며, 지금의 위치를 유지하려 할 것이다. 그 가운데 뛰어난 생성형 AI 기술을 기반으로 새로운 플랫폼 경제를 이끌 플레이어들이 나타날 것이다.
오픈AI는 생성형 AI를 기반으로 새로운 플랫폼 경제를 만들려고 하는 첫 번째 생성형 AI 기반의 플레이어인 것이다. 이 플랫폼을 통해서 개발자는 맞춤형 GPT를 개발해 스토어에 올리고, 소비자들은 GPT 스토어에서 원하는 GPT 챗봇을 다운로드 할 수 있는 마켓플레이스이다. GPT 스토어는 당연히 다양한 GPT 챗봇을 개발하는 크리에이터의 수익 창출의 공간이 될 것이다.
제4장 데이터가 정말 돈이 되는 시대는 지금부터 시작이다
진정한 초개인화는 데이터에서 만들어진다생성형 AI 시대의 대표주자인 챗GPT가 전 세계적으로 유행할 때 가장 많이 받았던 질문은 “이제는 초개인화가 가능해지는 건가요?”였다. 챗GPT가 마치 사람처럼 감정이 있는 듯 질문에 답변을 하기도 하고, 상당히 광범위한 분야의 질문에 대해서도 곧잘 대답을 할 수 있었기 때문이다. 이때 내 대답은 “초개인화는 AI 기술 자체보다는 AI 기술이 활용할 데이터가 훨씬 중요합니다. 따라서 초개인화의 핵심은 데이터에 있어요”였다.
개인화와 초개인화: 개인화와 초개인화를 간단히 구분하자면, 먼저 개인화는 고객의 이름, 나이, 소속, 구매내역 등과 같은 개인정보 및 거래 정보를 기반으로 커뮤니케이션하는 것이다. 이에 반해 초개인화는 한 단계 더 나아가 고객의 행동 및 실시간 데이터까지 활용하면서 고객과 관련성이 높은 상황에 따른 커뮤니케이션을 하는 것이다. 여기에는 개인의 취향, 특정 상품에 대한 검색 및 구매 내역, 웹 사이트 또는 모바일 앱에서의 사용자 활동 내역, 콘텐츠를 소비하는 데 소요된 시간, 선호 채널, 고객이 가장 활발하게 활동하는 시간 등의 데이터가 해당된다. 초개인화는 데이터가 핵심이다. 생성형 AI는 사람의 감정과 언어를 잘 모방하기 때문에 해당 사용자 고유의 정보와 결합해 더 매력 있는 콘텐츠들을 생성할 수 있다.
초개인화의 핵심, 데이터: 생성형 AI 기술은 도구로써 활용되어 좀 더 효과적으로 고객과 커뮤니케이션 할 수 있도록 콘텐츠들을 텍스트화하도록 도울 수 있다. 이는 고객을 위한 초개인화 서비스를 기존에 없었던 새로운 수준으로 끌어올릴 수 있으며, 또한 이를 대규모로 생성해낼 수 있다. 각 고객의 관심 사항에 맞춰 특별하게 맞춤화된 콘텐츠와 고객의 검색 행동이나 위치 기반으로 고객과 자연스럽게 대화를 나누고, 과거 대화 이력을 기억해 맞춤형으로 지원하고, 제품 추천을 할 수 있다면, 이는 최고의 초개인화 서비스가 될 수 있다. 또한 방대한 데이터를 기반으로 고객의 미래 행동과 성향 변화를 예측해 고객 맞춤의 개인화된 제안을 하고, 가장 효과적인 마케팅 채널과 시기를 예측할 수 있다.