IT 트렌드 2024
김지현 지음 | 크레타
IT 트렌드 2024
김지현 지음
크레타 / 2023년 10월 / 356쪽 / 20,000원
PART 1. 3번째 플랫폼, 공간으로 혁신하는 메타버스
메타버스의 그늘, 엔데믹과 챗GPT
‘메타버스의 신기루’ _ 허상인가, 실재인가?: 메타버스는 코로나19와 함께 우리 사회에 핫한 키워드로 떠올랐다. 그렇게 우리에게 소나기처럼 다가온 메타버스는 미쳐 이 기술이 무엇인지, 기존의 인터넷과 무엇이 다른지, 앞으로 어떤 변화와 비즈니스의 기회를 만드는 것인지 정의하지 못한 채 혼란이 가중되었다. 게다가 메타버스는 비대면 서비스가 갖는 한계를 극복하고 오프라인의 현실보다 더 진짜 같고 몰입감이 뛰어난 새로운 세상을 가져다줄 것이라는 환상이 지나치게 과장되기도 했다. 그 결과 엔데믹 시대를 맞이하며 메타버스에 대한 기대는 사그라지고 그 많던 관심은 썰물처럼 빠져나갔다.
지난 10년간 점진적으로 발전하던 메타버스는 본의 아니게 너무 일찍 샴페인을 터트린 셈이다. 게다가 2023년 초에는 챗GPT가 모든 것을 빨아들이면서 메타버스에 대한 설익은 기대는 실망감을 배가시켰다. 그렇다 보니 메타버스는 “실패한 기술”, “빈 수레가 요란했다”라는 비판에서 자유롭지 못했다. 과연 메타버스는 시티폰처럼 잠깐 유행하다 사라질 기술일까? 언젠가 이 부침을 극복하고 화려하게 백조처럼 부활할 수 있을까?
‘혼합현실의 미래’ 가상세계의 시작점: 메타버스와 관련하여 본격적으로 사용할 만한 제품이 선보인 것은 2015년 삼성 ‘기어VR’과 ‘오큘러스’를 시작으로 HTC의 ‘바이브’, 소니의 ‘플레이스테이션 VR’, 마이크로소프트의 ‘홀로렌즈’ 등이다. 하지만 이들 제품은 가격이 너무 비싸거나 기술적 완성도가 떨어지고, 쓸 만한 콘텐츠가 없어 보급에는 실패했다. 그런데 2020년 10월에 메타의 ‘오큘러스 퀘스트 2’가 전작 출시 1년 반 만에 50만 원대의 비교적 저렴한 가격에도 높은 성능으로 뛰어난 가성비를 보여주며 큰 주목을 받았다. 1년 만에 판매량이 1천만 대를 돌파하며 VR시장의 가능성을 증명했다. 그렇게 메타버스는 6년 만에 희망의 가능성을 보인다. 아마도 첫 출시 후 10년 정도가 되는 2025년에 메타버스가 본격 보급될 것으로 전망한다. 그러려면 메타버스가 명확한 사용자 가치를 보여주어야 한다. 메타버스는 우리에게 어떤 가치를 줄 수 있을까? 우선 메타버스는 입체적 공간 속에서 펼쳐지는 인터넷 서비스로 기존의 평면적인 컴퓨터와 다른 경험을 제공한다.
우리는 공간에서 움직이면서 3차원의 입체적인 정보를 보면서 살아간다. 그런데 컴퓨터나 스마트폰 속은 늘 평면으로 구성되어 있다. 하지만 메타버스가 구현한 세상은 현실과 닮은 공간이 있고 공간을 채우는 수많은 정보와 디지털 사물 그리고 사람들이 있다. 물론 그 세상은 우리가 사는 현실계와 연결되어 작동되기도 하고, 완전히 가상으로 존재해 운영되기도 한다. 이러한 메타버스는 기존의 컴퓨터나 인터넷보다 더 현실적이고 몰입감이 넘치는 입체적 인터넷 경험을 제공할 수 있다.
‘메타버스의 몰입도’ 온몸이 느끼는 인터넷: 메타버스는 기존의 웹이나 모바일과는 다른 큰 특징이 있다. 바로 콘텐츠의 유형이 다양하다는 점과 상호작용이 뛰어나다는 점이다. 컴퓨터는 스마트폰보다 화면이 크고 다양한 입력장치와 출력장치를 연결할 수 있고 컴퓨팅 파워가 뛰어나 여러 종류의 콘텐츠 포맷을 사용할 수 있어 스마트폰보다 더 입체적인 상호작용이 가능하다. 한마디로 기존에는 상상도 할 수 없었던 다양한 종류의 콘텐츠, 서비스를 경험할 수 있으며 몰입도가 높은 컴퓨터 사용이 가능하다. 단 이동성은 컴퓨터보다 조금 나은 수준으로 스마트폰과는 비교할 수 없을 만큼 미흡하다. 하지만 앞으로 안경처럼 쉽게 착용할 수 있는 크기로 경량화되고, 배터리 성능 향상과 지금보다 빠른 6G 등의 인터넷이 실현되면 이 문제도 해결될 것이다.
그렇다면 메타버스의 상호작용과 콘텐츠 유형은 어떤 서비스 경험을 가져다줄까. 메타버스에서의 입력 인터페이스는 ‘온몸’이다. 컴퓨터나 스마트폰처럼 손가락만 까딱까딱하는 것이 아니라 컴퓨터와 혼연일체가 되어 눈과 손뿐만 아니라 몸의 제스처와 고갯짓, 손짓, 몸의 방향과 시선의 움직임 등 다양한 입력 수단을 사용해서 인터넷 서비스를 이용한다. 그러므로 공간을 돌아다니며 공간 속의 사물은 물론 사람(아바타)과 상호작용할 수 있다.
메타버스 체험이 완성되기 위해서는 PC나 스마트폰으로는 부족하다. 새로운 경험을 위해서는 새로운 디바이스가 있어야 한다. 그런 측면에서 메타버스는 MR 기기를 통해 공간을 유영하며 다양한 상호작용을 통해 온몸으로 여러 서비스를 경험하는 것을 뜻한다. 물론 웹이나 모바일처럼 모든 인터넷 서비스를 포괄하기에 콘텐츠와 커뮤니케이션, 커뮤니티, 커머스 등 기존의 모든 서비스를 포함한다. 즉 메타버스는 웹과 모바일과 같은 계위에 있는 플랫폼이다.
PART 2. 트렌드와 패러다임 사이, AI의 반란
눈 떠보니 챗GPT와 LLM 세상
‘오픈AI’ _ 특이점이 온 AI, GPT-4와 챗GPT: 코로나19와 함께 인터넷 업계는 최대의 호황기를 겪다가, 엔데믹 시대를 맞이하며 자금 유동성 위협으로 2023년 최악의 혹한기를 경험했다. 그렇게 어둡기만 했던 IT 산업에 한 줄기 빛이 2023년 상반기를 비추었다. 바로 초거대 인공지능인 GPT-3.5로 구현된 챗GPT 덕분이다. 2023년 최고의 IT 트렌드(패러다임이라고 할 정도)는 바로 챗GPT였다. 그간 인터넷 패러다임은 웹 이전과 이후, 모바일 앱 이전과 이후로만 구분되겠다고 생각했는데, 이제 챗GPT 이전과 이후로 나눌 만큼 새로운 시대의 개막을 알릴 정도로 획을 그은 사건이었다.
챗GPT가 놀라운 점은 2가지다. 첫째, 사람과 자연어로 대화하는 방식으로, 둘째, 요청한 사항에 대한 결과물을 제시한다는 것이다. 챗GPT에는 검색처럼 최신의 콘텐츠가 반영되어 있지 않아 최신 내용이 결과물에 포함되지 않는다는 한계와 하나의 채팅 당 평균 130원의 상당한 비용이 들어간다는 한계를 가지고 있지만, 지난 20년간의 인터넷 사용 경험과 지난 40년간의 컴퓨터, 스마트폰 사용 방식을 바꾼다는 점에서 기술의 변곡점, 특이점이 온 것은 사실이다.
챗GPT는 구글 검색을 포함해 기존 인터넷 서비스의 대척점이 아닌 보완재로서의 기회를 제시할 것이다. 또 그간 실험실에서만 연구되던 초거대 AI가 오픈AI의 챗GPT와 그전의 이미지 생성 기계 학습 모델 ‘달리(DALL E)’ 등의 실체로 실제 사용자에게 호평받으면서, 구글 ‘람다(LaMDA)’, 마이크로소프트 ‘메가트론(Magatron)’, 네이버 ‘하이퍼클로바’ 등의 AI가 본격적으로 이들 빅테크 기업의 서비스에 적용되는 계기가 올 것이다.
사실 챗GPT도 검색도 모두 우리에게 좀 더 편리함을 준 도구에 불과하다. 전 세계의 정보를 페이지에 올려 서로 연결함으로써 정보의 보고가 된 인터넷이나, 이를 더욱 효율적으로 탐색하게 해준 검색엔진이나, 보다 정갈하게 정리해 주는 초거대 AI 모두 도구일 뿐이다. 이를 활용해서 판단하고 의사결정하기 위한 지식은 인간의 머리에서 나온다. 이들 도구는 우리의 지식을 더 두텁고 단단하게 해주는 수단일 뿐이다.
‘초거대 AI’ _ 시너지는 결국 메타버스: 챗GPT를 가능하게 한 기술은 LLM(Large Language Model; 거대 언어 모델)이라고 부르는 새로운 AI 모델이다. 챗GPT로 뜨거워진 IT 시장에 숨은 챔피언이 있다. 바로 엔비디아다. 챗GPT가 대화에 답하는 데 기존의 인터넷 서비스보다 100배 이상의 비용이 든다. 이는 GPU와 메모리 반도체를 만드는 엔비디아 등의 회사를 배 불리고 있다. 물론 LLM을 살찌우는 데 어마어마한 데이터 크롤링을 통한 데이터 수집과 축적도 필요한 만큼, 메모리 반도체를 만드는 삼성전자나 하이닉스도 뒤에서 웃고 있다.
하지만 모바일 시장이 성장하면서 스마트폰과 그 안에서 사용하는 카카오톡, 인스타그램, 배달의민족, 당근, 카카오T 같은 킬러앱이 주목받는 것처럼 앞으로는 LLM을 활용한 AGI(범용 인공지능) 서비스가 더 빛을 발할 것이고, 이때 이들 AGI 서비스를 PC나 스마트폰보다 더 잘 활용할 수 있는 메타버스 기기 같은 것들이 더 궁합이 맞아 부상할 수 있다.
키보드와 마우스, 손가락을 이용해 조작하는 것보다 AI에 대화하며 이야기하듯 인터넷 서비스를 사용하는 VR, AR, XR 같은 메타버스 기기가 더욱 편리할 것이다. 눈길 가는 곳마다 모두 디지털이 덧대어진 가상공간 속에서는 물리적인 키보드도 없고, 정교하게 조작할 마우스도 없다. 양손을 메타버스 기기가 인식할 수는 있지만 정교하지는 않다. 이때 말로 대화하며 필요로 하는 것을 제공하고 길잡이 역할을 할 수 있는 집사가 있으면 더할 나위 없을 것이다. 바로 초거대 AI가 그런 역할을 해줄 수 있다.
또한 우리가 기존에 사용하던 소프트웨어들이나 새로운 서비스로서 우리에게 다가올 수도 있다. 이미 마이크로소프트는 챗GPT를 팀즈(Teams)나 오피스 365와 같은 소프트웨어에 통합한다고 밝혔다. 팀즈로 화상회의를 하던 도중에 잠깐 자리를 비웠을 때 자동으로 회의 내용을 요약하거나 30분 발표 자료를 3~4분으로 요약할 수도 있다. 파워포인트에서 발표할 스크립트를 이야기하면 자동으로 목차를 구성하고 각각의 슬라이드에 들어가기 적합한 내용을 채울 수도 있다. 또 포토샵에 AGI가 내장되면 필요한 편집 작업을 말로 그때그때 요청할 수 있다. 그렇게 기존의 소프트웨어와 서비스들은 더 나은 생산성, 효율화를 위해 LLM, AGI를 적극 활용할 것이다. 구글도 워크 스페이스 서비스에 듀엣이라는 생성형 AI를 제공해 업무의 편의성을 꾀하고 있다.
생성형 AI 물결과 기업의 대응앞으로 더욱 많은 생성형 AI가 출시되면서 인터넷 기업 그리고 전통기업 더 나아가 개인들의 AI 사용도 더욱 보편화될 것이다. 게다가 LLM 역시 다양하게 출시되고 손쉽게 사용할 수 있도록 상향 평준화되고 있다. 덕분에 AI는 우리 일상과 사회 그리고 업무 속에 스며들며 편의성을 확장하고 있다.
‘진화’ 웹, 앱에서 생성형 AI로: 인류 문명 속에서 기록된 언어와 웹에 공개된 수많은 데이터를 통해 학습한 AI가 LLM이다. 챗GPT는 대화형 챗봇 서비스로, GPT-3.5라는 LLM을 통해 구현되었다. 지금은 GPT-4라는 한 단계 진화된 AI로도 서비스되고 있다. 챗GPT가 단기간에 전 세계의 이목을 받을 수 있었던 이유는 누구나 즉시 이용할 수 있을 만큼 사용법이 편했기 때문이다. 챗GPT는 인간의 언어로 학습한 AI다 보니 사람 말을 잘 알아들을 뿐만 아니라 화면을 통해서 필요한 정보나 질문을 자연어로 입력하면 결과물을 보여준다. 그래서 사용법이 쉽다.
클릭에서 터치로, 이제는 말로 되는 인터넷: 컴퓨터는 키보드와 마우스로, 스마트폰은 손가락으로 조작했다면 LLM 기반의 서비스는 글로 말로 작동시킬 수 있다. 챗GPT로 인해 달라진 가장 큰 변화는 각종 소프트웨어와 인터넷 서비스의 사용을 더욱 편리하게 해주는 대화형 UI라는 새로운 사용자 경험을 실현해 준 것이다. 일례로 키오스크에 LLM이 적용되면 화면에 나타난 여러 메뉴를 눌러가며 원하는 음식이나 음료를 주문하지 않아도, 키오스크 앞에서 원하는 것을 말하면 화면에 우리가 주문한 내역을 보여주고 즉시 주문할 수 있을 것이다.
그렇게 챗GPT가 보여준 것은 서비스를 사용하는 새로운 사용자 인터페이스다. AI에 필요한 것을 우리의 언어로 요청하면 AI가 대신 소프트웨어나 하드웨어를 작동해서 서비스를 제공한다. 어디서든 AI를 불러 필요한 것을 요청하면 자동으로 우리 요구 사항에 맞는 것을 수행하는 것이다. 사실 이러한 것을 “도처에 컴퓨터가 있다”라는 개념의 ‘유비쿼터스’, “조용히 컴퓨터가 알아서 작동된다”는 뜻으로 ‘앰비언트’라고 한다. 이 기술의 핵심에 AI가 있다. LLM이 사용자 콘텍스트와 주변의 인터넷에 연결된 모든 장치와 컴퓨터 등을 연결해서 자동으로 작동되고 운영되는 것이 궁극적인 미래의 모습이다.
이미 구글은 ‘팜(PaLM)’ LLM을 로봇에 접목해 더욱 지능적으로 작동되는 로봇을 연구하고 있다. 이 로봇에 “벽에 액자를 달 건데, 필요한 장비를 챙겨와”라고 명령을 내리면 못과 망치 등의 장비를 알아서 가져온다. 만일 망치가 없다면 대용으로 사용할 수 있는 벽돌이나 단단한 물체를 가져다주기도 한다. 기존의 로봇 시스템에서는 일일이 명령을 내려야 하는 것은 물론 망치가 있는 서랍의 위치와 열라는 명령에 이르기까지 중간에 필요한 과정에 대한 지시까지 개별적으로 해야 한다. 하지만 LLM이 로봇에 적용되면 주변의 환경을 인식하고 이를 언어로 해석 후, 최종 목표 수행을 위해 필요한 것을 알아서 구분해 정의하고 이를 수행한다.
메타버스를 구현하는 MR과 연동되어 작동되면 인터넷에 연결된 IoT를 좀 더 직관적으로 작동시킬 수 있는 가상의 버추얼 스위치를 각각의 기기 위에 띄워서 음성이나 손짓만으로 작동시키는 것도 가능하다. 전등을 바라보면 조명의 색상과 밝기를 조절하는 가상의 버튼이 나타나 즉각 조작할 수 있다. 또한 사물을 바라보면 그 사물에 대한 부가 정보와 기록해 둔 메모들을 열어볼 수 있다. 그렇게 집안의 전자기기들을 인식하고 각 기기의 작동 상태와 그간 동작된 데이터를 기반으로 LLM이 사용자 의도에 맞게 기기를 작동해 더욱 편리한 스마트홈 서비스를 사용하게 해줄 것이다.
‘초거대 LLM’ 기업 비즈니스 모델 혁신과 혁명: 생성형 AI 서비스는 크게 2가지로 나뉜다. 하나는 기존의 서비스에 생성형 AI 기술을 활용해 더 나은 품질로 개선하는 데 적용하는 X축이다. 다른 하나는 아예 새로운 생성형 AI 서비스를 개발하는 Y축이다. 모바일 시대에 수많은 앱이 신규 시장을 창출하며 새로운 사업을 전개한 것처럼 생성형 AI를 기반으로 사업 혁신을 꾀하는 것이다. 이렇게 2가지로 생성형 AI는 기업의 혁신에 활용될 수 있다. 그 외에는 수많은 생성형 AI를 한데 묶어 이들을 중계하는 웹의 검색이나 포털 같은 새로운 슈퍼앱이나 크롬의 확장 프로그램처럼 생성형 AI 내에 또 다른 AI를 연계하는 생태계가 마련될 수도 있다. 그렇게 생성형 AI가 다양한 모습으로 알게 모르게 우리의 일상에 정착하게 될 것이다.
LLM이 가져온 사회적 이슈
‘혼란’ _ 생성형 AI와 저작권 이슈: 2023년 1월 세계 최대의 이미지, 영상 플랫폼인 게티이미지는 스테빌리티 AI가 허가받지 않고 게티이미지 소유의 이미지 수백만 개를 학습에 사용했다고 주장하며 지식재산권 침해로 고소했다. 또 2023년 4월에는 소니 월드 포토그래피 어워드의 크리에이티브 부문에서 수상작으로 뽑힌 사진의 작가가 수상을 거부하는 일이 발생했다. 수상자인 독일의 보리스 엘다크젠은 거부 사유로 “AI로 생성한 사진”이라며 “생성형 AI를 이용해 40번 이상 프롬프트를 통해 만든 사진”이라고 밝혔다. 작가가 밝히지 않았다면 실제 촬영한 사진이 아닌 AI로 생성한 사진이 세계적인 협회의 수상작으로 선정되었을 것이다.
미국 최대 방송 영화 작가 노조(WGA)는 AI를 창작의 도구로 인정했지만, 창작자의 권리나 저작권은 없다는 원칙을 밝혔다. 이는 AI가 콘텐츠 생성을 위해 사전 학습 데이터로 광범위한 표절이 포함되었기에 저작권이 있을 수 없다는 것이다. 단, AI를 생산성 향상 도구로 활용해 창작한다면 이는 인간의 작품으로 인정한다는 단서를 달았다. 그만큼 생성형 AI를 작가의 창작 툴로서 적극 활용할 수 있는 길을 열어준 것이다.