AGI, 천사인가 악마인가
김대식 지음 | 동아시아
AGI, 천사인가 악마인가
김대식 지음
동아시아 / 2025년 8월 / 260쪽 / 18,000원
들어가며 - 인간에게 남겨진 ‘골든 아워’아시다시피 AI가 인간의 특정 능력 하나를 대체하는 기술이라면, AGI는 범용 인공지능, 즉 인간의 모든 또는 대부분의 능력을 대체하는 기술이라고 할 수 있습니다. AGI는 사실 불과 2~3년 전, 챗GPT가 나왔을 때까지만 해도 SF에나 나올 법한 소재로 치부되었습니다. 그런데 최근에는 상황이 달라졌습니다. 예로 오픈AI의 CEO 샘 올트먼은 앞으로 5년 내에 AGI가 가능해질 거라고 말하고 있습니다.
AI와 AGI는 확실히 다릅니다. AI는 우리가 좋은 쪽으로도, 나쁜 쪽으로도 쓸 수 있는 도구입니다. 여전히 우리의 통제하에 있다는 것입니다. 그런데 만약에 AGI로 진화한다면 상황이 달라질 수 있습니다. 때문에 우리에게는 다음과 같은 몇 가지 과제가 주어지고 있습니다. 첫 번째, 인간의 모든 능력을 대체한 이후로도 기계는 기하급수적으로 성장할 수 있을 텐데, 그런 기계를 인간이 컨트롤할 수 있을까? 두 번째, 설령 인간이 컨트롤한다고 해도 그 기술을 특정 국가 또는 단체가 악용하게 되지 않을까? 세 번째, 지구의 주인이 우리 호모 사피엔스에서 인공지능으로 대체되는 것이 아닐까? 이 3가지, 어떻게 보면 SF에서나 나올 것 같은 걱정을 이제 우리가 실질적으로 해야 할 순간이 도래했습니다.
우리의 미래는 어떤 모습일까?현재 인공지능, 특히 AGI에 대해서는 두 가지 시나리오가 있습니다. 첫 번째는 실리콘밸리 빅테크에서 일하는 많은 사람들이 지지하는 시나리오입니다. 바로 인공지능이 AGI에 도달하는 순간 우리 인간이 멍청해서 풀지 못했던 문제를 다 해결해 줄 거라고 믿는 것입니다. 무한한 에너지, 양자역학과 상대성이론을 드디어 합칠 수 있는 새로운 물리학 이론을 만들어 내고, 모든 노동을 기계가 해주고, 기후변화 문제도 해결해 줄 거라는 것이지요. 정말 유토피아가 만들어질 수 있다는 겁니다. 그러면 사회의 생산성이 무한히 늘어나서 우리 모두가 두바이 왕자 만수르처럼 살 수 있다는 주장입니다.
그래서 AGI를 빨리 만들어야 하고, AGI로 향하는 길에 걸림돌, 국가 규제 같은 것들을 다 없애야 한다는 것이 이들의 요지입니다. 일론 머스크, 피터 틸, 마크 앤드리슨 같은 이들이 이런 주장을 내놓는 사람들입니다. AGI가 인간에게 가져다줄 장기적 혜택이 너무나 크기 때문에 단기적 사회, 경제, 정치적 문제에 너무 집중해서는 안 된다는 이런 주장을 효과적 가속주의(e/acc)라고도 부릅니다.
한편 그들과는 달리, 장기적 인공지능의 혜택은 동의하지만 동시에 인공지능 안전에 대해서도 고민해야 한다는 주장을 효과적 이타주의(EA)라고 부릅니다. 제가 최근에 챗GPT한테 “AGI가 발달한 시대에 인간이 어떻게 사는지 그려줘”라고 요청해 봤습니다. 그랬더니 보여주는 결말이 안 좋았습니다. 대부분 계속 인공지능한테 쫓겨 다니고, 또 한쪽에서는 사람들이 막 기도를 하기 시작하더라는 겁니다. 이게 바로 두 번째 시나리오입니다. 실리콘밸리 빅테크 종사자들이 전망하는 유토피아와 대비되는 디스토피아 시나리오라고 할 수 있습니다. <터미네이터>나 <매트릭스> 시리즈 같은 영화에 등장하는 이런 인공지능 디스토피아 시나리오도 분명히 존재합니다. e/acc이나 EA 지지자들이 아무리 인공지능 유토피아를 주장해도 대부분의 일반인이 인공지능에 대한 거부감과 우려, 그리고 존재적인 위기까지 느끼는 이유가 바로 여기에 있습니다. 이게 바로 인공지능이 가지고 있는 천사와 악마, 두 가지의 얼굴입니다.
우리가 지금 서 있는 이 시점은, AGI가 완전히 모습을 드러내기 전 마지막으로 우리에게 주어진 극히 짧은 ‘골든 아워’일지도 모릅니다. AGI의 등장은 인류에게 유토피아를 가져다줄 수도 있고, 디스토피아를 초래할 수도 있습니다. 이런 미래의 불확실성 속에서 어떤 선택을 해야 할까요? 답은 아직 보이지 않지만 한 가지 확실한 점이 있습니다. 이 골든 아워가 지나고 나면, 생각할 시간조차 주어지지 않을 수도 있다는 점입니다. 그렇기에 지금, 우리는 미래와 마주할 준비를 해야 합니다.
모자이크 모멘트(Mosaic Moment)최근 인공지능에 대해 쏟아지고 있는 폭발적인 관심은 2022년 11월, 챗GPT가 등장하면서 시작됐습니다. 하지만 인공지능의 역사는 정말 오래됐습니다. 1956년에 처음 제안됐지만 그로부터 수십 년 동안 인공지능은 그저 SF적인 공상에 불과했습니다. 그런데 챗GPT가 등장하면서 갑자기 인간은 기계와 대화를 할 수 있게 되었습니다. 그래서 이제는 챗GPT를 ‘모자이크 모멘트’라고도 평가합니다.
참고로 지금은 거의 모든 사람들이 워낙 인터넷을 자연스럽게 쓰고 있습니다만, 아주 예전에는 인터넷이라는 게 없었습니다. 놀랍게도 제 학생들은 그걸 이해하지 못해서 저에게 물어보곤 합니다. 그러면 옛날에는 도대체 하루 종일 뭘 했느냐고요. 그런데 곰곰이 생각해 보면 인터넷을 뒷받침하는 TCP/IP라는 통신 기술은 이미 1960년대 말 그리고 1970년대 초에 다 완성이 됐었습니다. 그런데 제가 AGI 얘기를 한다고 그러더니 왜 갑자기 인터넷 이야기를 할까요? 이유가 있습니다. 인터넷의 역사를 다시 한 번 되새겨 봄으로써 인공지능의 미래를 상당히 많은 부분 예측해 볼 수 있습니다.
그래서 잠시 인터넷의 역사에 대해서 이야기해 볼까 합니다. TCP/IP는 훌륭한 기술입니다. 잠재적으로 이 세상에 있는 모든 사람과 정보를 연결해 줄 수 있습니다. 그런데 초기 인터넷은 인터페이스가 좋지 않았습니다. 상당히 사용하기 어려웠고, 나름의 전문성과 코딩 수준의 능력이 있어야만 실질적으로 인터넷을 사용할 수 있었습니다. 그래서 인터넷이 완성되고 나서 거의 20년 동안 인터넷을 실제로 체험할 수 있었던 일반인들은 몇 명 없었습니다. 이게 중요한 지점인데, 아무리 좋고 훌륭한 기술이라 해도, 결국 그 기술을 직접 체험하는 사람의 니즈와 욕구, 상상력에 따라 사용 범위가 결정될 수밖에 없습니다. 그런데 초기 인터넷 경험자들은 다들 엔지니어, 전문가들에 한정되었기 때문에, 기껏해야 우리는 인터넷으로 편지를 보내는 ‘이메일’ 정도밖에는 생각해 내지 못했습니다.
그런데 1990년대 초부터 상황이 달라졌습니다. 팀 버너스리가 월드 와이드 웹(WWW)을 제안했습니다. 바로 우리가 아는 웹 페이지의 형태입니다. 그리고 더 중요한 건 1993년에 처음으로 인터넷 브라우저가 등장했다는 것입니다. 이 최초의 브라우저를 모자이크(Mosaic)라고 불렀습니다. 모자이크는 지금 우리가 아는 모든 인터넷 브라우저의 조상이라고 생각하면 됩니다.
브라우저가 등장하고 나서 갑자기 상황이 달라졌습니다. 더 이상 코딩할 필요 없이 마우스로 단어를 누르기만 하면 간단하게 인터넷을 경험할 수 있게 된 것입니다. 덕분에 1990년대 중반부터 일반 소비자들이 인터넷을 제대로 체험하기 시작했고, 이 방식은 우리가 지금도 휴대폰에서 쓰고 있습니다. 이런 혁신적인 사용자 경험의 변화가 모자이크라는 브라우저에서 시작됐습니다. 여기서 따와서 모자이크 모멘트라는 말이 나왔습니다. 인공지능의 역사에서는 챗GPT가 바로 거기에 해당합니다.
브라우저의 등장에 힘입어 일반 소비자들이 인터넷을 체험하기 시작하면서 신기한 일이 벌어졌습니다. 일반 소비자들이 인터넷을 체험하자마자, 그 전 20년 동안 전문가들은 생각조차 하지 못했던 새로운 활용 방식을 생각해 냈던 것입니다. 1990년대 후반부터 갑자기 일반 소비자들은 인터넷으로 쇼핑을 하고 있었습니다. 그런데 이건 엔지니어들은 20년 동안 전혀 상상도 못 했던 영역입니다. 그리고 2000년대 초, 갑자기 일반 소비자들은 인터넷으로 친구들과 교류하고 싶어 했습니다. 이게 바로 소셜 네트워킹입니다. 이것도 마찬가지입니다. 소셜 네트워킹이 중요하다고 생각한 엔지니어는 아무도 없었습니다. 그런데 일반 소비자들은 그게 중요하다고 생각했던 것입니다.
그리고 당시 대기업들은 이 인터넷 트렌드를 놓치고 말았습니다. 대기업 결정자들은 저와 같은 선입견을 가진 전문가들이었습니다. 그들의 눈에는 쇼핑이나 소셜 네트워킹이 하나도 중요해 보이지 않았습니다. 대신 이런 선입견이 없었던 스타트업들이 소비자의 새로운 욕구를 인식하고 그에 기반한 비즈니스를 시작했고, 그중 몇 기업이 우리가 아는 빅테크로 진화했습니다. 아마존은 1996년에 설립됐고, 구글은 1998년에 설립됐습니다. 이와 비슷한 일이 인공지능 분야에서 지금 벌어지고 있습니다.
이처럼 인공지능이라는 개념은 오래됐지만, 지난 50년 동안 인공지능을 실질적으로 경험할 수 있었던 사람들은 전문가들뿐이었기 때문에, 기껏해야 상상하는 건 자율주행 자동차나 킬러 로봇 따위에 그쳤습니다. 그런데 챗GPT의 등장으로 인터페이스가 바뀌었습니다. 우리가 일상생활에서 쓰는 자연어로 인공지능을 경험할 수 있다는 건, 일반 소비자들이 2022년부터 비로소 처음으로 인공지능을 체험하게 되었다는 것입니다. 앞으로 수년 동안 일반 소비자들은 전문가들이 생각조차 하지 못했던 새로운 애플리케이션들을 생각해 낼 겁니다. 그리고 이 소비자의 새로운 욕구를 가장 먼저 인식하고 실행하는 기업들이 미래의 빅테크가 될 거라고 현재 예측하고 있습니다.
생성형 AI의 출현처음에 인공지능을 통해 풀고자 했던 2가지 문제는 세상을 알아보는 기술과 언어를 이해하는 기술이었습니다. 그런데 2012년에 이르러 기계가 드디어 세상을 알아보기 시작했습니다. 이런 기술을 우리는 인식형 인공지능 또는 퍼셉션 AI라고 부릅니다. 이 기술은 10년 전부터 쓰이고 있었고, 지금 이 순간에도 물류센터에서 이 기술로 택배를 구분하고 있습니다. 하지만 두 번째 문제가 해결되지 않았습니다. 그런데 지난 5년 동안 언어 문제를 푸는 과정에서 ‘생성형 AI’라는 두 번째 혁신이 있었습니다. 흥미로운 사실은 언어 문제가 해결되니까 나머지 문제들도 덩달아 해결되기 시작했다는 것입니다.
그럼 인공지능이 고양이와 강아지는 구분하는데, 왜 언어는 이해하지 못했을까요? 이유가 있습니다. 인공지능은 멀티 레이어 퍼셉트론으로 인식을 합니다. 그런데 픽셀과 픽셀 간에는 통계적으로 인과관계가 거의 없습니다. 그래서 각 픽셀은 독립적으로 계산할 수 있고, 병렬 처리가 가능한 알고리즘입니다. 바로 여기에서 역사적인 우연이 발생합니다. 미국에 작은 반도체 회사가 있었습니다. 엔비디아입니다. 엔비디아는 병렬 처리를 효율적으로 할 수 있는 새로운 반도체 구조, GPU를 제안했습니다.
원래 엔비디아는 인공지능과는 상관 없는 회사였습니다. 컴퓨터 그래픽이나 비디오 게임을 더 빠르게, 원활하게 구동하기 위해 GPU를 만들었는데, 토론토대학교 연구원들, 특히 나중에 챗GPT를 디자인한 제프리 힌턴의 제자였던 일리아 수츠케버가 이걸 보고 “잠깐, 이 알고리즘을 CPU로 계산하면 너무 오래 걸리는데, 엔비디아의 GPU를 잘 사용하면 기계 학습에도 쓸 수 있겠구나”라고 생각했습니다. 그래서 GPU를 몇 개 구비해서 학습시켰더니, 상상을 초월할 정도로 학습이 빨라졌다는 겁니다. 참고로 이런 기술을 가속기라고 부르게 됐습니다. 말하자면 이게 신의 한 수였습니다.
물론 당시에는 몰랐습니다. 학습이 수천 배 빨라졌다는 건, 현실적으로 모델을 더 키울 수 있다는 얘기입니다. 예전에는 모델을 키우고 싶어도 계산이 몇 달 걸리니까 키울 수가 없었습니다. 근데 이제 몇 시간 만에 계산이 끝나니까 욕심이 나게 됩니다. “모델 좀 키워볼까?”, “고양이 사진 더 넣어볼까?” 그리고 나중에 알게 된 거지만, 인공지능에서는 스케일을 키우면 문제가 풀리게 됩니다. GPU가 등장했기 때문에 더 많은 데이터를 학습시킬 수 있었는데, 사실은 그게 결정적인 해답이었던 겁니다. 아주 우연히 이 방법을 찾았고, 덕분에 엔비디아는 엄청난 인공지능 회사로 성장했습니다.
다가올 다음 단계의 AI는 어떤 모습일까?2025년 CES에서 엔비디아 CEO 젠슨 황이 이런 얘기를 했습니다. 2012년 제프리 힌턴 덕에 인식형 AI(Perception AI)가 드디어 고양이와 강아지를 구분할 수 있게 되었습니다. 그리고 2017년 트랜스포머에 이어 2022년 챗GPT라는 생성형 AI가 나왔지요. 이제 우리는 생성형 AI 시대에 살고 있습니다. 앞으로 로드맵은 뻔합니다. 다음 우리가 맞이하게 될 것은 다름 아닌 에이전트 AI(Agent AI)입니다.
지금까지의 LLM(Large Language Model, 거대 언어 모델)은 사람이 물어보는 것에 대한 대답만 했습니다. 예를 들어, 제 연구실에 있는 학생이 공부를 안 한다고 가정해 볼까요? 제가 “공부 열심히 해” 하면 “네, 교수님” 하고 아무것도 안 하죠. 하지만 제가 원하는 건 이런 대답이 아니라 학생이 행동을 취하는 거였습니다. 마찬가지로 “여름에 이탈리아 가고 싶어, 비행기표 알아봐” 하면 AI가 “지금 알아보겠습니다.” 하고 끝내는 게 사용자들의 진짜 바람이 아닙니다. 거기에서 나아가 실제로 예약하고 호텔과 레스토랑까지 추천해 주는 것이, 진짜 이용자들이 원하던 것이라는 얘기입니다.
AI가 이걸 하기 위해서는 인간이 애플리케이션을 켜고 메뉴를 누르는 데이터를 멀티모달(Multi Modal)로 학습하면 됩니다. 그러면 에이전트 AI가 가능해집니다. 그리고 다음 단계는 피지컬 AI(Physical AI)입니다. 에이전트 AI는 디지털에서만 행동할 수 있고, “물 한 잔 가져다줘” 같은 아날로그 요청은 들어줄 수 없습니다. 하지만 로보틱스와 결합된 피지컬 AI가 등장하면, 아날로그 현실에서 에이전트 AI 역할을 해줄 수 있습니다. 디지털은 에이전트 AI, 현실은 로봇이 해결하는 겁니다.
에이전트 AI는 2025~2030년, 약 5년 안에 가능할 거라고 보고 있습니다. 오픈AI는 2025년 1월 24일 ‘오퍼레이터’를 공개했습니다. “오늘 저녁 레스토랑 추천해 줘” 하면 예약까지 해줍니다. 하지만 문제는 한 번에 한 문제밖에 못 푼다는 것이지요. 회사에 직원이 한 명뿐인 셈이라 비효율적입니다. 회사는 여러 직원이 동시에 여러 문제를 풀고, 서로 소통할 필요가 있습니다. 이게 멀티 에이전트(Multi-Agent)입니다. 오픈AI는 2025년 여름 멀티 에이전트를 공개하겠다고 했는데, 2025년 3월 6일 중국에서 ‘마누스(MANUS)’라는 멀티 에이전트가 나왔습니다. 에이전트 20개가 동시에 작동해 호텔, 항공, 레스토랑 예약을 병렬로 처리하고 정보를 공유합니다. 아직 완벽하진 않지만 늦어도 5년 안에 멀티 에이전트가 보편화될 거라고 예측하고 있습니다.
무서운 상상다니엘 코코타일로의 2027년 AI 시나리오 보고서를 보면, 수십 년 안에는 우리 모두가 AGI를 경험할 가능성이 높다고 합니다. 그런데 이 보고서에서 강조하는 AGI로 가는 단계, 그 첫 번째는 AI가 자동으로 코딩을 시작하는 겁니다. AI가 코딩을 한다는 건 AI를 사용해서 인공지능 연구를 할 수 있다는 뜻입니다. 현재 예측으로는 AI가 산업에 미치는 영향이 가장 큰 분야 중 하나가 인공지능 연구 분야 그 자체입니다. 빅테크 기업들이 경쟁하려면 인공지능 연구의 효율성을 높이는 게 다른 어떤 분야보다 경제적 이익이 크기 때문이지요. 인공지능을 더 빨리 연구하면 다른 산업도 이어서 혁신할 수 있게 됩니다. 보고서는 AI가 코딩을 자동화하면 어느 순간 인간의 명령을 어기기 시작할 거라고 봅니다.
여기서 시나리오가 두 가지로 갈립니다. 첫째, 미국이 오픈AI 같은 인공지능 회사를 국영화해서 발전 속도를 늦추는 겁니다. 국영화되면 AI 발전이 느려질 가능성이 있습니다. 둘째, 국영화하지 않으면 AGI 다음 단계인 ASI, 즉 초지능(superintelligence)으로 빠르게 넘어갑니다. AI는 인간의 특정 능력을 대체하고, AGI는 인간의 모든 능력을 대체하게 됩니다. ASI는 인간과 인공지능의 지능 격차가 너무 커져서 인간이 도저히 따라갈 수 없는 수준의 지능을 말합니다.