AI 임팩트
이주선 지음 | 굿인포메이션
AI 임팩트
이주선 지음
굿인포메이션 / 2021년 7월 / 298쪽 / 19,800원
인공지능은 어디서 출발해서 여기까지 왔나?
기원이 된 아이디어들과 앨런 튜링인공지능이란 사람이 수행하는 지능적인 작업을 기계인 컴퓨터가 모방할 수 있도록 하는 모든 기술을 의미하며, 인간의 지능을 컴퓨터로 구현해서 궁극적으로 출현하는 ‘생각하는 기계’이다. 그러므로 인공지능은 자신의 목적 달성에 맞는 지능적인 존재가 되는 것이 최종적인 도착지가 될 것이다. 이런 기계에 대한 상상은 어디서부터 시작되어 21세기 초반 사람들의 주목을 독차지하는 대세가 되었을까?
근대 인공지능 연구의 기원은 르네 데카르트가 1637년 그의 명저 방법서설에서 ‘인간은 기계’라는 주장으로부터라고 할 수 있다. 데카르트는 그의 인간론에서 동물과 인간은 육체라는 기계이나, 인간은 경험을 쌓은 기계이며 뇌는 그 태엽에 해당한다고 주장했다. 이 기계론적 인간론이 컴퓨터와 인공지능 출현의 철학적 기반이 되었다. 그를 이어서 고트프리트 라이프니츠는 1666년 그의 “조합의 기술에 관한 학위 논문”에서 모든 개념들을 제한된 수의 단순한 개념들의 조합으로 환원할 수 있다는 생각에 근거해서, 이진법 논리를 토대로 형식적인 추론을 하여 철학적인 논쟁들을 해결하려고 했다.
1747년에는 줄리앙 오프레이 드 라 메트리가 인간기계론에서 18-19세기 유럽에서 인기를 끌었던 자동인형(automaton)을 뛰어넘는 오늘날 인공지능 로봇 개념의 자동인형이 등장할 것이라고 주장하였다. 철학의 이런 유물론적 관점에 입각해서 현대적인 인공지능 가능성에 대한 구체적인 언급이 시작된 것은 19세기 중반 이후이다. 우리나라의 조선왕조 말기인 1842년 영국의 유명한 시인 조지 바이런의 딸, 에이다 러브레이스는 찰스 배비지의 해석기관에 대한 분석에서 현대적 의미의 인공지능 가능성을 처음 언급했고, ‘베르누이 수’를 구하는 알고리즘을 만들었다.
이후 20세기 중반인 1936년 ‘컴퓨터 과학의 아버지’라고 불리는 앨런 튜링은 “계산 가능한 수와 그것의 결정문제에 대한 적용: 수정본”이란 논문에서 ‘튜링기계(Turing Machine)’를 제안하였고, 1940년대에 실제로 디지털 컴퓨터가 발명되었다. 1943년에는 워런 매컬러와 월터 피츠가 “신경활동에 내재된 생각들의 논리적 미적분”이란 논문에서 각 신경세포의 기능은 매우 단순하지만, 이들이 상호 연결되어 복잡한 계산을 하는 신경망이 만들어진다는 것을 2진법 출력을 가진 ‘매컬러-피츠 모델’로 구현하였다. 이것이 현재의 인공신경망 또는 신경망이 진전되는 데 핵심적인 혁신을 만들어냈다.
또한 튜링은 1950년 ‘생각하는 기계’의 구현 가능성에 대한 분석이 담긴 인공지능 역사의 ‘시원적인(seminal)’ 논문, “계산 기계와 지능”에서 컴퓨터가 사람의 지능을 흉내 내려고 시도할 수 있음을 시사하고, 컴퓨터가 사람의 지능과 같은 수준에 도달하였는지 여부를 시험(test)하기 위한 튜링 테스트(Turing test)를 제안하였다. 한편 1951년 피츠와 매컬러에게 배운 민스키는 진공관을 이용해서 사람의 뇌에 있는 뉴런의 연결망을 모사한 세계 최초의 신경망 컴퓨터 SNARC를 만들었다. 같은 해 영국 맨체스터 대학교의 크리스토퍼 스트레치는 페란티 마크 1(Ferranti Mark 1)을 사용해서 최초의 체커(checker) 프로그램을, 디트리히 프린츠는 최초의 체스(chess) 프로그램을 만들었다.
그리고 1950년대 중반 몇몇 과학자들은 직관적으로 기계가 수를 다루듯 기호(symbol)를 다루고, 사람처럼 기호의 본질적인 부분까지 다룰 수 있을 것이라고 생각했고, 이것이 인공지능 연구에서 ‘기호주의(Symbolism) 학파’의 시원이 되었다. 한편 1956년 대표적인 기호주의자들인 카네기 멜론 대학교의 앨런 뉴얼과 허버트 사이먼은 최초 인공지능 시스템이라 할 수 있는 ‘논리 이론가(Logic Theorist)’를 개발하여 알프레드 화이트헤드와 버트런드 러셀의 수학 원리에 나오는 52개 정리 중 32개를 증명해 냈고, 일부 새롭고 더 우아한 증거를 찾아내기도 했다.
3차 황금기 - 딥러닝의 압승과 AGI 가능성사람의 적극적 개입이라는 제약조건을 뚫고 딥러닝 신경망의 부활을 확고히 하여 오늘날 인공지능 붐을 조성한 결정적인 전기는 2012년에 만들어졌다. 페이페이 리가 주도해서 조성된 이미지넷 데이터 세트들(빅데이터)을 토대로 주최한 2012년 “이미지넷 대규모 이미지 인식 경연대회”에서 딥러닝 혁명을 이끈 힌튼, 르쿤, 벤지오가 공동으로 만든, 독자적으로 학습, 추론, 판단을 하는 ‘합성곱신경망(CNN)’ 기술 기반 딥러닝을 탑재한 인공지능 ‘알렉스넷’이 압도적인 성적으로 우승을 한 것이다.
르쿤의 제자인 캐나다 토론토 대학교의 알렉스 크리제프스키가 일리아 서스케버, 힌튼과 만든 알렉스넷(Alex Net)은 8개의 신경망을 가지고 있으며, 그 컴퓨팅을 CPU(central processing unit)가 아니라 병렬 컴퓨팅에 유리한 GPU(graphic processing unit)를 사용했다. 결국 CNN 기반 딥러닝에 GPU컴퓨팅 역량을 접목하여 이런 괄목할 만한 성과를 낸 것이다. 이후 이 대회를 우승한 인공지능들은 모두 CNN 기반 딥러닝 알고리즘들이 차지했다. 한편 알렉스넷의 우승 2년 후인 2014년은 인공지능 연구의 중심으로 떠오른 딥러닝 연구가 학계 중심에서 구글, 페이스북, 바이두 등 기업 중심으로 전환되는 해였다. 기업들의 직접적인 인공지능 투자 붐이 다시 본격화되기 시작한 것이다.
이런 가운데 구글 지주회사 알파벳의 자회사로 범용인공지능 연구 개발의 선두기업인 딥마인드(Deep Mind)의 CEO 데미스 허사비스가 개발한 바둑 인공지능 ‘알파고-판’이 2015년 처음으로 유럽바둑챔피언 판 후이 2단에게 5번 모두 승리하여, 그 당시까지는 전문가들이 실현 불가능할 것이라고 여겼던 바둑에서 그 이름을 알렸다. 이듬해인 2016년에는 다시 ‘알파고-리’가 세계바둑챔피언인 한국의 이세돌 9단과의 대국에서 4:1로 승리하여 세계의 이목을 집중시켰다. 이 알파고는 2016년 3월 사람들의 기보 16만 건을 학습한 후 이세돌 9단을 상대해서 승리했는데, CNN 기반 딥러닝 신경망 12개로 인간들의 기보에 대한 지도학습과 알파고 자체 게임을 이용한 강화학습을 모두 사용하고, 구글이 자체 개발한 애플리케이션 집적회로 TPU(Tensor processing unit) 48개를 사용한 분산 시스템이었다.
이어서 ‘알파고-마스터’가 2017년 5월 바둑 세계 랭킹 1위인 중국의 커제 9단을 3:0으로 이겼다. 이 알파고는 신경망 개수를 40개로 늘린 반면, 4개 TPU만 사용하는 단일 컴퓨터 시스템으로, 독자적 강화학습만 해서 학습과 의사결정 능력을 향상시켰을 뿐만 아니라 컴퓨터의 연산능력도 획기적으로 절감하는 혁신 시스템이었다. 다시 2017년 10월 딥마인드는 네이처에 알파고의 마지막 버전인 ‘알파고-제로’를 발표하였는데, 이 알파고는 인간 기보에 의존하는 지도학습 없이 바둑규칙만으로 72시간 학습한 뒤, 알파고-리와의 대국에서는 100전 100승, 그 후 40일에 걸쳐서 2,900만 판을 혼자 둔 뒤에는 알파고-마스터와의 대국에서 100전 89승 11패를 기록하였다. 빅데이터를 통한 지도학습이 필요 없는 새로운 인공지능이 출현한 것이다. 이러한 성과들로 알파고는 세계에서 가장 강력한 인공지능임을 세계인 모두에게 각인시켰음은 물론 범용인공지능의 가능성에 대한 관심을 고조시켰다.
한편 딥마인드는 2018년 12월 알파제로의 기술을 적용해서 단백질의 ‘3차원 접힘구조’를 파악하는 인공지능 ‘알파폴드’로 98개 연구팀들이 참가한 “단백질 구조 예측 경연대회”에서 사람 전문가들을 압도적 차이로 누르고 우승했다. 이는 딥마인드의 인공지능 기술이 게임 영역을 떠나서 인류가 현재까지 풀지 못한 여러 난제들의 해결을 위하여 응용될 수 있음을 시사하는 것이었다. 앞으로 날씨 예측, 기후 모델링, 자연어 이해 등 프로젝트에 알파제로를 포함한 혁신 인공지능 기술들을 적용한 시스템들을 이용하는 프로젝트들이 지속적으로 발전해 나가는 전기가 될 것으로 기대된다.
그리고 불과 한 달이 지나지 않은 2019년 1월 딥마인드는 온라인 게임 인공지능 ‘알파스타’가 1주일간 사람이 200년 학습할 분량을 학습한 후 “스타크래프트 2 게임”에서 평균 8분 만에 한 번꼴로 중ㆍ상위권 유럽 프로게이머들인 TLO(다리오 뷘시)와 마나(Mana: 그레고리 코민츠)에게 10승 1패의 전적으로 승리한 것을 발표했다. 또한 2019년 10월 네이처는 알파스타가 게임서버 배틀넷에서 최고 레벨인 ‘그랜드 마스터(상위 0.2%에 해당하는 선수)’에 올랐다는 논문을 게재했다.
이러한 알파스타의 기록은 알파제로를 포함한 알파고 시리즈를 넘어서 스타크래프트 등 불완전 정보 게임들에서도 사람 지능과 대등하거나 월등한 역량을 보였다는 것을 의미한다. 이는 알파스타의 지능이 불확실성 하 정보의 불완전성이 존재하는 상태에서, 의사결정이나 문제해결 능력에서도 사람의 역량에 근접하거나 사실상 능가한 것을 의미한다. 결국 이는 사람이 사는 현실 세계에서도 인공지능이 주어진 상황과 관계없이 사람을 능가하는 지적능력을 가지는 단계로 점점 접근하고 있는 것으로 해석될 수 있다. 그러나 여전히 ‘게임’이라는 특정한 환경하에서의 불확실성을 다루고 있으므로 게임이론으로 설명할 수 없는 많은 변수와 환경을 가진 현실세계에서 사람의 지적역량을 가지기에는 아직도 갈 길이 상당히 멀다고 많은 전문가들은 판단하고 있다.
사람과 필적할 인공지능은 어떻게 출현할까?
딥러닝 인공지능 기술이 가진 한계많은 전문가들은 인공지능이 사람의 지능과 동등한 범용인공지능(AGI) 또는 그보다 우월한 초지능으로 발전할 것이라는 데 동의하고 있다. 참고로 인공지능이 사람의 지능을 추월하는 시점을 특이점이라고 하는데, 현재 많은 전문가들이 ‘특이점에 언제 도달할 것인가?’에 대해서만 견해 차이를 보이고 있을 뿐, 이런 시기가 오리라는 것에는 거의 모두 동의하고 있다. 그러나 많은 전문가들이 여전히 현재의 인공지능이 초보단계에 있다는 점을 지적하고 있기도 하다. 그러므로 여기에서는 먼저 현재 최첨단 인공지능 기술인 딥러닝이 AGI로 진화하는 데 어떤 한계를 지니고 있는지 살펴보고자 한다.
첫째, 현재의 딥러닝 기반 인공지능은 사람의 지능에 비해서 아주 좁은 영역의 제한된 능력만 가지고 있어 AGI로 발전하기 위해서는 수백 가지 알고리즘이 더 필요하다. 사람의 생물학적 시스템은 수백 가지 알고리즘이 복잡하게 얽혀서 시각적인 원동력, 계획, 추론, 감정, 의도 및 끈기가 효율적인 조화를 이룬 지능을 가짐으로써 범용성을 가진다. 그러나 딥러닝 기반 인공지능은 지각과 이미지 인식이 중요한 능력이나, 이는 AGI가 필요로 하는 지각 및 이미지 인식 능력 가운데 극히 일부분일 뿐이라 현실적으로 다양한 문제를 푸는 데 한계가 명백하다.
둘째, 딥러닝은 매우 복잡한 것들을 어떤 특정한 포인트들이나 곡선 등에 맞추는 일종의 ‘곡선 적합(curve fitting)’ 작업이므로, 결과가 이론적으로 사실과 동떨어진 것을 보지 못하고, 전에 보지 못한 새로운 행동들을 하지도 못한다. 사람은 인지(cognition)의 세 가지 차원인 지각(perception), 개입, 상상을 할 수 있는데, 인지의 가장 높은 차원인 ‘상상’에는 사후가정 사고가 필요하다. 예로 사람은 “내가 다르게 행동했다면 세상은 어떻게 바뀌었을까?”라는 상상 시나리오를 만들고 이야기할 수 있는데, 이때“만일 …이었다면”이라는 것이 사후가정 사고에 해당한다. 바로 이 사후가정 사고가 새로운 이론을 만들거나, 발명을 하거나, 오래된 습관을 버리거나, 지금까지 없던 세상을 만드는 데 중요한 역할을 한다. 그런데 딥러닝은 이 능력이 없어서 사람처럼 복잡한 이론적 지식이나 인과관계에 대한 추론과 문맥의 이해 등 구조화된 지식에 대한 효과적 학습이 어렵고 새로운 행동을 할 수도 없다.
셋째, 딥러닝은 실제로는 ‘스스로 학습’하는 게 아님은 물론 주어진 문장과 연관이 없는 단어의 ‘의미’를 이해하지 못하고, 학습 데이터의 확보와 데이터 레이블링에 큰 비용이 수반된다. 덧붙이면 딥러닝이 하는 학습은 레이블된 데이터에 기반해서 정교하게 데이터를 분류하고 예측하는 지도학습이 중심인데, 이 학습을 위해서는 데이터를 준비하고, 알고리즘을 설계하며, 학습결과에 대한 검토와 개선을 하는 데 사람이 매우 광범위하게 개입해야만 한다. 또한 딥러닝은 사람과 달리 단어를 이미지나 동영상 또는 현실에 있는 것과 쉽게 연결시키지 못한다.
넷째, 딥러닝의 학습은 막대한 데이터 처리를 위해서 엄청난 용량의 컴퓨팅 파워와 이에 필요한 대규모 에너지 사용이 불가피하다. 딥러닝을 계산적 관점에서 보면 결국 거대한 행렬 곱셈의 연속이며, 컴퓨터는 이런 연산을 빠르게 할 수 있는 계산기이므로 컴퓨팅 파워는 학습 효율과 직결된다. 그러므로 딥러닝의 업그레이드를 위해서 컴퓨팅 파워의 획기적 향상이 필수적이다. 결국 이는 무어의 법칙이 작용하던 컴퓨팅 파워 향상이 10년 이내에 한계상황에 도달할 것이라는 예상을 고려할 경우, 처리비용 상승 문제를 어떻게 해결할 것인가 하는 과제를 남긴다.
다섯째, 딥러닝은 사람같이 ‘상식’을 가지고 있지 않아서 왜곡 또는 편향된 데이터가 입력되면, 결과가 왜곡되거나 정확도가 떨어질 수 있다. 딥러닝은 이미지의 픽셀을 해석할 뿐 이미지에 포함된 객체에 대한 지식(상식)이 없으므로, 왜곡되거나 정확도가 떨어진 결과를 낼 수 있다. 여섯째, 딥러닝은 고성능 컴퓨팅 파워와 알고리즘 기반이어서 컴퓨팅 인프라 고장이나 알고리즘 오류가 발생하면 예상치 못한 결과의 오류가 발생할 수 있다. 이러한 사례들은 대단히 많다.
일곱째, 딥러닝은 설명력(explicability)이 낮은 블랙박스(black box)이다. 이러한 설명력 부족은 입력변수가 수십, 수백 단계의 변형을 거쳐서 최종 모형에 반영됨으로, 입력된 변수와 출력된 결과의 직접적인 관계를 추적하는 것이 어려워서 발생한다. 여덟째, 현재 딥러닝을 포함한 잘 알려진 인공지능들은 새로운 개념적 혁신이라기보다는 과거 경험된 이론들의 시제품(demo)들에 불과하므로 그 범용성(generality)이 제한적이다. 아홉째, 딥러닝의 접근법이 사람의 인지발달과정과 다르게 진화해 나가고 있다. 사람은 사회적 동물이며 사회적 상호작용을 통해서 지능을 개선해 왔는데, 딥러닝의 접근법은 이런 방향의 기술발전 방식을 채택하지 않고 있다.
기계지능이 사람 수준으로 발달할 조건들우리는 컴퓨터가 범용적 특징을 가진 자연지능과 대등한 지능을 가지려면 어떻게 해야 할지에 대한 큰 방향을 정리해 볼 수 있다. 첫째, 사람의 ‘두뇌가 어떻게 생각하는가?’라는 질문에 답하는 것이 AGI 개발의 핵심 실마리이다. 지금까지 대부분 기계는 육체적 능력을 대신하여 왔으나, 인공지능(컴퓨터)은 정신적인 능력을 확장시켜 주는 도구이기 때문이다. 특히 두뇌는 절반이 지능과 관련되어 있고, 지능은 운동체계, 의사결정, 감정, 의식 및 언어와 밀접하게 연계되어 있다. 이렇게 두뇌의 기능은 하나의 대상을 인식하는 게 전부가 아니라 지능을 깊이 정의하는 중요한 요소이기 때문에 이에 집중해야만 진전이 가능할 것이다. 둘째, 아이들이 사람 수준의 지능으로 가는 핵심 열쇠가 될 수 있다. 아이들 수준의 지능에서 시작해서 신뢰할만하고, 재귀적이며(reflexive), 견고한 확장 방법으로 여론 수준의 지능을 발전시킬 수 있을 것이다. 이렇게 하려면 처음 지능을 만들 때는 언어가 없는 단계에서 시작해야 한다. 그러고 나서 사람이 태어나 자라가면서 어떻게 배우는지를 이해해서 학습할 수 있게 되면, 진정한 범용인공지능(AGI)으로 나아갈 수 있을 것으로 보인다.