IT 트렌드 2025
김지현 지음 | 크레타
IT 트렌드 2025
김지현 지음
크레타 / 2024년 10월 / 324쪽 / 20,000원
PART 1. 2025 IT 키워드 10
IT 트렌드 2024 다시 보기
‘AI’ _ 모든 것을 삼켜버리다: 2024년은 2023년에 이어 AI가 모든 이슈의 중심에 섰다. 전년보다 AI의 파고는 더 높고 거세졌으며 영향력도 더욱 커졌다. 기술은 더욱 다변화, 고도화되고 활용하는 영역은 확장됐으며, 우리 사회와 산업 전반에 더 큰 영향을 끼쳤다. 오픈AI의 전유물일 것이라 생각했던 LLM(large language model; 대규모 언어모델)은 이제 기존의 빅테크 기업인 구글, 마이크로소프트, 아마존, 메타, 테슬라까지 뛰어들었다. 또한 앤스로픽, 코히어 등 비교적 규모가 작은 스타트업에까지 영역이 점차 확대되었고, 미국을 비롯해 한국, 중국, 독일, 프랑스, 싱가포르, 인도에 이르기까지 많은 국가에서 만들고 있다. 게다가 LLM이 오픈소스로도 공개되고 있어서 이를 이용해 SLM(small language model; 디바이스에 구동되는 AI 모델)도 여러 산업과 기업의 입맛에 맞게 만들어지고 있다.
LLM은 이제 언어뿐만 아니라 오디오, 비디오, 이미지 등 다양한 멀티미디어 포맷을 인식하고 해석하면서 사용의 폭이 넓어지고 있다. LMM(large multimodal model; 거대 멀티모달 모델)을 통해 말로 묻고, 글로 대답하는 것을 넘어 사람의 눈과 귀처럼 보고 들을 뿐만 아니라 소리, 그림, 영상 등 다양하게 표현할 수 있다. 더 나아가 AI에 외부의 서비스와 기계가 연결되면서 실행 영역도 확장하고 있다. AI가 단순히 답변만 하는 것을 넘어 특정한 작업을 완결하는 것이다. AI가 자동차 제어권을 가지면서 자율주행을 할 수 있는 것처럼 직접 작동할 수 있는 대상이 늘고 있다. 그런 AI가 산업용 로봇이나 휴머노이드 로봇과 결합한다면 로봇을 자동화하고 지능화해서 작동시킬 수 있다. 2024년 AI는 더욱 고도화되고 다변화하면서 적용 영역이 점점 확장됐고, 이와 함께 다양한 분야로 영향력이 증강되었다.
‘클라우드와 디지털 트랜스포메이션’ _ 고도화, 가속화, 다양화: AI의 저변 확대는 클라우드를 또다시 초고도로 성장할 발판을 만들었다. 2010년부터 매년 무려 두 자릿수 성장률을 보이며 고도로 성장한 클라우드를 1.0이라고 하자. 클라우드 1.0의 효과는 비용 절감, 유연성, 확장성 3가지였다. 특히 스타트업과 중소기업이 막대한 자금 투자 없이도 자원을 사용할 수 있어 초기 비용을 줄일 수 있었다. 이후에도 사업 발전 속도에 맞춰 클라우드를 필요한 만큼 임대할 수 있어 디지털 트랜스포메이션이 전 산업 영역으로 확대되는 과정에서 최대로 수혜를 누렸다.
LLM이 클라우드를 통해 서비스되면서 클라우드의 사용량과 적용 영역은 더 널리 확산 중이다. 실제 마이크로소프트는 클라우드 플랫폼 애저(Azure)에 GPT-n과 자사의 새로운 AI 모델 MAI를, 구글은 GCP(Google Cloud Platform)에 자체 생성형 AI 모델 제미나이(Gemini)를, 아마존은 AWS에 자체 LLM 올림푸스(Olympus)를 탑재했다. LLM이 필요한 수많은 IT 기업과 스타트업, 전통기업은 클라우드의 기반 모델(FM; Foundation model)을 이용해야 하니 저변이 더 확대되는 것이다.
그렇다면 기업은 왜 LLM을 사용하려는 것일까? 바로 AI를 활용해 다방면으로 비용을 절감해 사업의 효율성을 높이기 위함이다. 더 나아가 AI 기반으로 기업의 비즈니스 모델을 전환하고 새로운 상품 기획과 개발 등 신사업 분야로 진출하려는 목적도 있다. 10년 전부터 기업이 해오던 디지털 트랜스포메이션의 연장선 상에서 빅데이터와 디지털 트윈 등에 이은 새로운 기술이 등장한 것이다. 즉 AI는 디지털 트랜스포메이션이 더 고도화, 가속화, 다양화할 수 있는 기반을 마련했다.
전통기업 중 기존 사업을 효율화하기 위해 생성형 AI를 클라우드 기반으로 사용해 업무 효율성을 높이기도 하고, AI 기술을 이용해 새로운 고객에게 신규 상품을 선보여 사업 전환을 하기도 한다. 전자의 경우가 마이크로소프트 코파일럿(Copilot)이나 챗GPT, 뤼튼(wrtn) 등의 생성형 AI 기반의 서비스를 사용한다. 이미 여러 전통기업이 기획, 개발, 마케팅 등의 업무 편의와 효율성을 높일 목적으로 도입하고 있다. 후자는 어도비 포토샵에 도입된 파이어플라이(Firefly)나 스포티파이의 AI DJ 등의 서비스가 대표적이다. 기존 상품을 더 혁신적으로 개선해 사용자 경험을 바꾸고, 이를 적극적으로 활용하는 과정에서 클라우드와 AI의 사용량이 늘어난다.
AI가 이끄는 2025년
‘생성형 AI’ _ 앱으로 스며들다: 챗GPT 이후 새로운 AI 서비스에 대한 기대감이 커지면서 다양한 종류의 AI 서비스가 하루가 멀다 하고 출시되고 있다. 마치 2010년대 앱스토어에 모바일 앱이 넘쳐나던 때의 분위기다. 하지만 AI 서비스가 새로운 앱으로 탄생할 필요는 없다. 기존에 사용하던 서비스에 생성형 AI와 LLM 기술이 접목되어 더 나은 편의성과 품질을 제공하고 있다. AI는 어떻게 우리가 사용하던 웹 서비스와 각종 소프트웨어, 모바일앱에 스며들까?
MS 오피스에 챗GPT가 스며들어 탄생한 코파일럿은 소프트웨어를 더욱 편리하게 사용하도록 돕는다. 엑셀 함수를 몰라도 데이터 분석과 그래프를 그릴 수 있고, 파워포인트의 다이어그램 디자인을 몰라도 PPT 문서를 구성할 수 있으며, MS 워드 문서 전체를 읽지 않아도 요약 정리할 수 있다. 윈도우 11에서도 코파일럿을 이용하면 각종 설정을 변경하고 문서를 찾을 수 있다. 마우스를 이용해 일일이 메뉴를 선택하고 화면을 클릭하지 않아도 필요한 것을 프롬프트 창(대화창)에 입력하면 자동으로 프로그램을 수행한다. 윈도우 사용법이나 매뉴얼을 뒤적이지 않아도 필요한 기능을 사용할 수 있다.
생성형 AI는 새로운 서비스에만 적용되는 것이 아니라 기존의 앱에도 스며들고 있다. 익스피디아나 부킹닷컴 등의 여행 정보 서비스에서도 생성형 AI를 활용한 상담 창을 통해 여행 코스를 찾고 내게 맞는 여행 상품과 숙박, 교통편 등을 한 번에 예약할 수 있다. 예를 들어 제주도로 3박 4일간 맛집 여행을 간다고 해보자. 예산은 200만 원이다. 그러면 이에 맞게 호텔과 항공권 등을 새롭게 재구성하는 데 생성형 AI를 사용한다. 이미 있는 상품을 검색하는 것이 아니라 여행자의 필요에 맞게 추천하는 데 LLM 기술이 쓰인다. 사용자는 검색어 입력창이 아니라 상담 대화창을 통해 필요한 사항을 마치 상담사와 대화하듯이 입력하면 적정한 콘텐츠와 상품 구성을 제공받을 수 있다. 그렇게 기존의 여행 앱에 AI가 스며들면서 더 나은 서비스 경험을 할 수 있다.
또한 야나두나 콴다 같은 영어나 수학 학습 서비스에도 생성형 AI가 적용되고 있다. 원어민 못지않은 영어 실력의 AI 교사가 문제를 풀어주고, 스마트폰 카메라로 수학 문제를 촬영하면 이를 인식해 AI가 개인 교사처럼 코칭을 해주듯 다양한 과정과 설명을 보여주며 문제 풀이에 도움을 준다.
줌에 적용된 회의록 요약 AI나 슬랙과 노션에 탑재된 AI도 페이지에 기록된 내용을 요약하거나 분류, 정리 같은 간단한 일과 PDF나 특정 인터넷 페이지의 문서를 분석해 표로 정리하는 등 여러 작업을 도와준다. 덕분에 팀 회의나 협업 과정에 시간이 단축될 뿐 아니라 더욱더 빠르게 정보를 분석할 수 있다. 게다가 AI가 다양한 관점의 코멘트를 해줄 수 있어 여러 시각의 의견을 참고할 수도 있다.
음악 앱 스포티파이에서 서비스하는 AI DJ는 음악 청취 경험을 기존의 모바일 앱과 완전히 다르게 바꿔준다. AI DJ는 사용자의 개인 DJ가 내 상황에 맞는 음악을 들려주면서 음악이 마음에 드는지, 내게 말을 걸면서 추천한다. 기존처럼 내가 직접 나서서 능동적으로 음악을 찾아 듣는 방식이 아니라 선제적으로 음악을 들려주면서 동적으로 음악을 들을 수 있도록 한다.
그렇게 AI는 점차 우리가 사용하는 웹 서비스와 모바일 앱에 자리를 잡아간다. AI가 탑재된 앱과 그렇지 않은 앱의 사용성, 편의성, 접근성, 성능이 크게 달라지며 AI는 우리가 사용하는 모든 서비스에 스며들어 가랑비에 옷 젖는 줄도 모르게 익숙해질 것이다.
‘LAM’ _ PC와 스마트폰으로 침투하다: 2023년이 챗GPT로 인해 LLM이 부상했다면, 2024년은 LLM이 더욱 고도화되면서 동시에 다양한 버티컬 산업에서 사용되며 작은 LLM이라 불리는 SLM으로 분화되고 있다. 그리고 2024년 하반기부터는 인간의 언어를 넘어 우리가 보고 듣는 것까지도 포괄적으로 인식해 이미지, 영상, 소리 등의 다양한 포맷으로 데이터를 생성하는 LMM이 떠올랐다. 더 나아가 LAM로 AI가 인식과 이해, 생성하는 것을 넘어 실행으로까지 이어지고 있다. 2025년은 LLM, LMM, LAM 이 3가지 AI 기술이 더욱 다양한 영역에서 새로운 가치를 만들 것이다.
간단한 코딩, 번역, 지식 탐색, 데이터 분석, 문제 풀이 등에 사용되던 AI가 다양한 데이터를 인식하고 여러 가지 포맷의 데이터를 생성하면서 활용처가 나날이 늘고 있다. 이미 챗GPT는 이미지를 인식하는 것을 넘어 생성까지 기본으로 제공하고 있다. 챗GPT에 이미지 생성형 AI 달리(Dall-E)를 추가했고, 영상생성기 소라(Sora)까지 통합될 것이다. 생성형 AI가 만드는 데이터의 포맷이 많아지면서 반대로 다양한 포맷의 데이터까지 인식하고 이해할 수 있게 되었다.
이 기술이 컴퓨터, 스마트폰과 결합하면서 기존의 컴퓨팅 기기의 사용성을 개선하고 있다. LMM은 보고 들을 수 있는 AI로, 스마트폰으로 촬영한 사진이나 영상, 더 나아가 컴퓨터로 작업 중인 화면과 소리를 인식할 수 있다. 즉 내 스마트폰이나 컴퓨터로 어떤 소프트웨어를 실행해서 무엇을 하고 있는지 알 수 있다. 또 이해하고 부가적인 정보를 안내하며 자동화 서비스를 제공한다. 무엇을 어떻게 하는지 이해한다는 것은 작동할 수도 있다는 의미다. 화면을 이해하는 기술이 LMM이고, 따라 할 수 있는 것이 LAM이다. 컴퓨터나 스마트폰에 AI가 내장되어(디바이스에서 구동되는 AI 모델. 이를 SLM이라 한다) 사람 대신에 소프트웨어를 실행하고 앱을 넘나들며 특정한 작업을 수행할 수 있게 된 것이다.
윈도우 11은 5초마다 PC의 모든 작업을 스냅샷으로 기록하는 ‘리콜(Recall)’ 기능을 2024년 5월 20일부터 선보였다. 이 데이터를 기반으로 사용자가 어떤 정보든 검색할 수 있다. 채팅 앱에서 주고받은 메시지나 웹으로 검색했던 모든 페이지, 열어본 파일 등에 대한 정보를 AI로 검색할 수 있다. LMM 덕분에 가능해진 기능이다.
애플은 2024년 6월 WWDC(애플 세계개발자회의)에서 아이폰에서 작동되는 AI 서비스를 발표했다. 아이폰으로 촬영한 사진을 편집하고 새로운 이모티콘을 생성하며, 다양한 앱에서 주고받은 데이터를 쉽게 검색할 수 있다. 예를 들어 “지난주 제주도 해변에서 촬영한 ‘김범준’ 사진을 ‘강지원’에게 메시지로 보내줘”라고 명령하면 사진 앱에서 검색해 메신저 앱을 실행한 뒤 사진을 전송하는 일련의 행위가 일괄 자동으로 처리된다. 이것이 바로 LAM 기능이다.
도이치텔레콤은 2024년 2월에 열린 MWC(모바일 기기 박람회)에서 앱 프리 폰을 선보였다. AI 에이전트에 명령을 내리면 앱을 다운로드하지 않고도 AI가 할 일을 대신 수행한다. 마이크로소프트도 윈도우 12에 코파일럿을 활용해 마우스를 사용하지 않아도 지시만으로 자동으로 작업할 수 있게 사용자 경험을 적극 확대할 예정이다. LAM 덕분에 차세대 기기나 소프트웨어 출시가 가능해졌다.
AI가 글을 잘 이해하고 검색, 요약 정리, 분석하는 것을 넘어 사진과 소리를 인식해 특정한 작업까지 수행하면서 AI 에이전트의 용도는 더욱 강력해지고 있다. 즉 인간의 언어를 이해하고, 보고 듣는 것을 인식하며, 다양한 작업을 수행할 수 있는 자동화된 초지능형 AI가 구현되고 있다. AI 에이전트는 영화 <아이언맨>의 ‘자비스’처럼 인류가 기계와 소프트웨어, 인터넷 서비스를 초개인화, 초자동화로 사용할 수 있다. 이를 가능케 한 기술이 바로 AI의 삼두마차인 LLM, LMM, LAM이다. 앞으로 하드웨어, 소프트웨어를 사용하는 주체는 인간이 아닌 AI일 것이다. 사람 대신에 명령을 인식해 의도에 맞게 자동으로 조작하는 AI 에이전트 시대의 개막이 머지않았다.
‘임바디드 AI’ _ 로봇은 상상이 아닌 현실이다: 2000년대 들어 지능형 서비스를 위한 로봇 개발이 활발해지면서 가정용 청소 로봇, 반려 로봇, 교육·의료 보조 로봇이 등장했다. 기존의 로봇이 공장에만 머물렀다면 사무실이나 가정 같은 사적인 공간으로 확대됐다는 점이 가장 큰 특징이다.
로봇 산업에 특이점이 온 것은 로봇의 구조가 자연 생태계 속 동물이나 인간을 닮아가고, 수행하는 작업도 하나가 아닌 점에서다. 다양하고 새로운 것을 학습해 작업 영역이 많아지고, 작동 방식도 인간의 명령을 인지하기 시작한 2015년 이후부터 급격히 발전했다.
2015년쯤 유튜브에 강아지처럼 네 개의 다리가 달린 4족 로봇과 사람처럼 두 다리가 달린 2족 로봇이 산을 안정적으로 걸어 다니는 영상이 공개되며 업계와 대중의 관심을 끌었다. 화제의 주인공은 보스턴 다이내믹스의 스팟(spot)과 아틀라스(Atlas)다. 사람들은 로봇이 지형 변화가 심하고 장애물이 있는 산을 균형 있게 걸어 다니는 모습을 보고 충격과 공포를 느꼈다. 보스턴 다이내믹스는 로봇 산업의 특이점을 보인 대표 사례다. 이 기업은 2013년 12월에 구글이, 2017년에 소프트뱅크 그룹이 인수했고, 2021년에 현대자동차그룹이 인수하며 새 주인이 됐다.
2024년 3월 휴머노이드 로봇 개발 제조 스타트업 피규어AI(Figure AI)가 오픈AI와 협업해 만든 AI 로봇 피규어 01(Figure 01)의 영상을 공개했다. 이 AI 로봇은 사람과 음성 대화를 하면서 실시간으로 내린 명령에 반응해 작업을 수행한다. “테이블 위에 무엇이 보여?”라고 물으면 “사과와 컵, 접시가 담긴 식기 건조대, 테이블 앞에 서 있는 당신이 보인다”고 대답한다. “먹을 것을 달라”고 하면 사과를 집어 건네고 “왜 사과를 주었는지?” 물으면 “테이블에 있는 유일한 음식이기 때문”이라고 답한다. 또 “식기를 어디에 옮겨야 할 것 같아?”라는 질문에 “식기 건조대에 들어가야 한다”고 말한다. 피규어 01은 로봇이 직접 보고 들으면서 주변 상황을 인식하고 판단해 행동한다. 또 수행한 작업을 기억해 논리적으로 설명할 수 있으며, 말하는 동시에 행동하는 것이 가능하다.
2024년 8월 6일에는 기존 모델보다 속도와 배터리 용량이 개선된 피규어 02가 공개됐다. 공개 영상에는 이 로봇이 BMW의 생산라인에 투입돼 여러 작업을 수행하는 모습을 보였다. 이렇게 LLM이 로봇이라는 물리적 실체를 가지고 우리가 사는 현실계로 출현할 날이 곧 올 것이다. 테슬라는 2023년 9월에 휴머노이드 로봇 옵티머스(Optimus)를 공개했고 12월에는 더욱 동작이 빠르고 자연스러워진 옵티머스 2를 발표했다. 이 로봇에 테슬라의 CEO 일론 머스크가 설립한 AI 스타트업 XAI의 AGI(Artificial General Intelligence; 범용 인공지능)가 탑재된다면 사람과 비슷한 크기와 몸무게의 외형을 가지면서 사람보다 더 뛰어난 지능을 가진 인간형 로봇이 탄생할 것이다.
현실에서 사람처럼 눈과 귀, 입을 가지고 세상을 배우면서 학습하는 AI 로봇. 즉 임바디드 Al(embodied Al) 산업이 본격화되고 있다. 이러한 로봇은 인간이 작업하는 모든 작업장에서 인간보다 더 나은 지능과 체력을 가지고 작업을 수행할 것이며, 전 세계 산업 구조와 노동 시장에 근본적인 변화를 가져올 것이다. 특히 인간형 로봇, 즉 휴머노이드 로봇은 AI 기술의 발전과 더불어 로봇 산업에 새로운 가능성을 열고 있다. 인간과 유사한 외형에 움직임도 비슷해 인간과의 상호작용과 협업에 최적화된 형태로 생활 공간과 환경에 자연스럽게 스며들 수 있다. 로봇이 지금보다 인간의 일상에서 더 효율적으로 활동하면 인간과의 상호작용이 더 자연스럽고 효과적으로 이루어질 것이다.