예측 기계
어제이 애그러월 외 지음 | 생각의힘
예측 기계
어제이 애그러월 외 지음
생각의힘 / 2019년 1월 / 335쪽 / 18,000원
들어가는 말 - 기계 지능
아이가 숙제를 하고 있다. 질문이 들린다. “델라웨어의 주도는?” 부모는 생각한다. ‘볼티모어? 아닌 것 같은데……’ 하지만 생각이 끝나기도 전에 알렉사(Alexa)가 정답을 알려 준다. “델라웨어의 주도는 도버입니다.” 알렉사는 아마존의 인공지능(AI)인데 자연어를 해석해 빠른 속도로 질문에 답한다. 알렉사는 부모를 대신하는, 아이 눈에는 모르는 것이 없는 정보원이다.
우리가 세운 크리에이티브 디스트럭션 랩(CDL)은 과학을 기반으로 하는 스타트업의 성공 확률을 높이기 위한 초기 단계의 프로그램이다. 당초 CDL은 모든 스타트업에 문호를 개방했지만, 2015년에 우리가 가장 주목한 벤처 사업은 대부분 인공지능을 활용하는 기업들이었다. 우리는 인공지능이 곳곳에서 활용되는 모습을 지켜보면서 이런 기술이 사업 전략에 미치는 영향에 초점을 맞춰 연구했다.
인공지능은 예측 기술이고, 예측은 의사결정에 필요한 입력 데이터(input data)이며, 경제학은 결정의 기초가 되는 트레이드오프(trade-off)를 이해하는 데 필요한 프레임워크를 제공한다. 예측 기술의 발전이 미칠 영향력을 제대로 이해하고 있지 못해도, 경제학에서 말하는 의사결정 이론의 오래된 논리를 적용하면 인공지능에 접근하는 데 필요한 일련의 통찰력을 얻을 수 있다. 이 책에는 우리가 처음으로 알아낸 중요한 통찰이 제시되어 있다. 즉, 인공지능이라는 새로운 물결이 가져다준 것은, 지능이 아니라 지능의 중요한 요소인 ‘예측’이다. 아이가 질문을 했을 때 알렉사가 했던 것은 소리를 듣고 아이가 한 말을 예측한 다음, 그 말이 찾고 있는 정보가 무엇인지 예측하는 행위였다. 사실 알렉사는 델라웨어의 주도를 ‘알지’ 못한다. 그러나 알렉사는 사람들이 그런 질문을 할 때 그들이 특정한 대답, 즉 ‘도버’를 찾는다는 사실을 예측할 줄 안다.
이 책은 인공지능 경제에서 성공하기 위한 레시피가 아니다. 오히려 우리는 ‘트레이드오프’를 강조한다. 데이터가 많다는 것은 프라이버시가 줄어든다는 뜻이다. 속도가 빠르다는 것은 정확도가 떨어진다는 뜻이다. 자동화된다는 것은 통제가 줄어든다는 뜻이다. 우리는 당신의 사업에 최고의 전략을 처방하지 않는다. 당신의 회사, 당신의 경력, 당신의 국가에 가장 좋은 전략은 당신이 모든 트레이드오프의 각 방면에서 어떤 식으로 비중을 배분하느냐에 달려있다. 이 책은 가장 좋은 결정을 내릴 수 있도록 핵심 트레이드오프를 찾아내고, 유불리(有不利)를 따질 수 있는 방법론적 구조를 제시한다.
값이 싸지면 모든 것이 바뀐다
예측은 빠진 정보를 채우는 과정이다. 예측은 ‘데이터’라고도 불리는 지금 가진 정보를 활용해 가지고 있지 않은 정보를 만들어낸다. 그런데 새로운 인공지능 기술은 예측의 비용을 떨어뜨린다. 그리고 예측의 비용이 내려가면 예측의 횟수가 늘어난다. 예를 들어 1960년대에 컴퓨터 산업의 도약으로 연산 비용이 빠르게 내려가자, 사람들은 이미 기존의 데이터로 연산을 하고 있던 여러 분야에서 더 많은 연산을 했고, 나중에 사진처럼 애당초 연산과 관련이 없는 분야에서도 값이 싸진 연산을 사용하기 시작했다. 원래 사진은 화학의 영역이었지만, 연산 비용이 크게 떨어지면서 연산 기반의 솔루션, 즉 디지털 카메라로 옮겨갔다. 디지털 이미지는 0과 1의 조합으로, 연산을 이용해 눈으로 볼 수 있도록 재조립한 이미지다. 무엇보다도 예측의 비용이 계속 내려가기 때문에 원래 예측의 영역이 아니었던 곳에서도 예측이 활용된다는 점이 중요하다.
인터그레이트닷에이아이의 캐스린 하우는 어떤 문제를 예측 문제로 재구성하는 능력을 ‘인공지능 통찰력(AI Insight)’이라고 부른다. 요즘 웬만한 엔지니어들은 대부분 인공지능 통찰력을 갖추고 있다. 예를 들어 차량도 예측의 영역으로 진입했다. 자율주행 차량이 엄격하게 통제되어 예측이 가능한 환경이 아닌 다른 곳에서도 기능을 발휘할 수 있게 된 것은 엔지니어들이 운행을 예측 문제로 재구성하게 된 이후였다. 그들은 기계에 어떤 환경에서 어떤 일을 하라고 말하는 대신 한 가지 예측, 즉 ‘인간이라면 어떻게 할까?’에만 초점을 맞출 수 있다는 사실을 알아냈고, 이제 기업들은 시내와 고속도로 등 통제되지 않은 환경에서도 자율운행이 가능하도록 기계를 훈련시키는 데 많은 돈을 쏟아붓는다.
예측의 값이 싸지면 예측이 더 많아지고 예측에 대한 보완재도 더 많아진다. 이런 두 가지 간단한 경제적 요인을 바탕으로 예측 기계는 새로운 기회를 만들어 낸다. 예측 기계는 예측하는 인간의 업무를 덜어 주어 비용을 절약하고, 예측 기계의 가동률이 높아질수록 의사결정의 질은 향상된다. 그러다 예측의 정확도가 높아지고 신뢰할 만한 수준이 되는 순간, 예측 기계는 조직의 일 처리 방식을 통째로 바꾼다. 일부 인공지능은 기업 경제에 매우 극적인 영향을 주기 때문에 당초 전략과 달리 더 이상 생산성을 높이는 용도로만 사용되지는 않을 것이다. 즉 인공지능은 아예 전략 자체를 바꿀 것이다.
예측
왜 지능이라고 하는가?
‘딥러닝’이라 불리는 최근의 발전의 토대가 되는 핵심 기술은 역전파(back propagation)라는 방식이다. 역전파는 사례를 통해 배운다. 자연 두뇌와 비슷한 방식으로 번거로운 모든 절차를 피하는 것이다. 아이에게 ‘고양이’라는 단어를 가르치고 싶다면 고양이를 볼 때마다 그 단어를 말해 주면 된다. 머신러닝도 기본적인 원리는 같다. 머신러닝에 ‘고양이’라는 라벨이 붙은 고양이 사진을 무수히 입력하고, 또 ‘고양이’ 라벨이 붙지 않은 고양이가 없는 사진을 무수히 입력한다. 그러면 기계는 ‘고양이’라는 라벨과 관련된 픽셀의 패턴을 인식하는 법을 배운다.
고양이와 개가 있는 사진을 많이 갖고 있으면 고양이와 다리가 넷인 대상의 연결 고리가 강화될 테지만, 개와의 연결 고리도 역시 강화될 것이다. 좀 더 구체적으로 밝히지 않고, 개가 없는 사진을 비롯해 여러 다른 변수가 있는 수백만 장의 사진과 라벨을 기계에 입력하면, 기계는 더 많은 연관 관계를 개발해 개와 고양이를 구분하는 법을 배운다. 이제 문제는 알고리즘 문제(고양이의 특징은 무엇인가?)에서 예측 문제(라벨이 없는 이 사진에는 내가 전에 봤던 고양이의 특징이 있는가?)로 바뀌었는데, 머신러닝은 확률 모델을 사용해 문제를 해결한다. 왜 머신러닝을 인공지능이라고 하는가? 머신러닝의 출력 결과, 즉 예측은 지능의 핵심 요소다. 그 때문에 예측의 정확도는 배워서 향상시킬 수 있고, 예측의 정확성이 높으면 기계가 대상 인식 같은, 인간의 지능이 개입해야 하는 임무를 수행할 수 있다.
제프 호킨스는 『생각하는 뇌, 생각하는 기계』에서 처음으로 예측이 인간 지능의 기본이라고 주장했다. 그런 주장의 본질은 창의력과 생산성 향상의 핵심이 되는 인간 지능의 우수성이 우리의 두뇌가 메모리를 사용해 예측하는 방법에서 기인한다는 것이다. 호킨스는 우리가 어떤 것을 경험할 때, 즉 보고 느끼고 들을 때 우리 두뇌는 끊임없이 예측한다고 주장한다. 신체와 정신이 발달하고 성숙하면서, 두뇌의 예측은 점점 더 정확해진다. 즉 예측은 종종 현실이 된다. 그러나 예측이 앞일을 정확하게 예측하지 못하면 우리는 뭔가 잘못되었다는 것을 알아채게 되고, 그 정보는 두뇌로 다시 입력되고, 두뇌는 그 정보의 알고리즘을 업데이트해 학습하고 모델을 더욱 향상시킨다. 호킨스의 주장은 논란의 여지가 있다. 하지만 기반이 되는 모델의 적정성 여부와 관계없이, 예측이 지능의 기반이라고 강조하는 호킨스의 주장은 최근 변화를 모색하는 인공지능의 영향을 이해하는 데 도움이 된다.
머신러닝이 보여 주는 최근의 진전은 인공지능의 진전으로 간주되기도 한다. 그 이유는 이런 기술을 기반으로 하는 시스템이 스스로 학습해 시간이 갈수록 성능이 향상되고, 이런 시스템이 정해진 조건에서 다른 방식보다 훨씬 더 정확한 예측을 내놓는 데다, 일부 전문가들은 예측이 지능의 핵심이라고 주장하며, 이들 시스템에 의한 예측의 정확성이 향상되면서 번역이나 내비게이션처럼 인간의 지능으로만 가능하다고 여겼던 과제를 수행할 수 있게 되었기 때문이다.
의사결정
결정의 해체
어떤 직종이나 어떤 업무에서도 가장 중요한 것은 결정이다. 관리자는 자신의 팀에 합류시킬 팀원과 승진시킬 사람을 결정한다. 의사는 어떤 약을 처방하고 비용이 많이 드는 검사를 해야 할지 결정한다. 그런데 결정은 보통 불확실한 상황에서 이루어진다. 의사는 값비싼 검사를 꼭 해야 하는지 확신하지 못한다. 이들은 모두 예측을 해야 한다. 그러나 예측은 결정이 아니다. 결정은 예측을 판단한 다음 취하는 행동이다. 최근에 인공지능에서 큰 진전이 있기 전만 해도 인간은 항상 예측과 판단을 동시에 했다. 이 둘을 구분하는 문제는 학자들의 관심사일 뿐 그 이상은 아니었다. 하지만 기계 예측이 발전하면서 인간은 결정의 과정을 면밀히 해부하고 검토해야 하는 입장이 되었다.
예측 기계는 결정에 직접적인 영향을 준다. 그러나 결정에는 다른 핵심 요소 여섯 가지가 있다. 누군가가(또는 어떤 것이) 결정을 할 때, 그들은 ‘예측’을 할 수 있게 해 주는 ‘입력 데이터’를 세상으로부터 얻는다. 예측이 가능한 것은 유형이 다양한 데이터들의 관계와 어떤 데이터가 어떤 상황과 가장 밀접하게 연관되어 있는지 ‘트레이닝’을 했기 때문이다. 의사결정권자는 주요 관심사에 대한 예측과 ‘판단’을 종합한 다음 어떤 ‘행동’을 선택할 수 있다. 그 행동은 하나의 ‘결과’를 낳는다. 그 결과는 결정의 결과다. 결과는 또한 다음 예측을 향상시키는 데 필요한 ‘피드백’을 제공할 수도 있다.
예측은 결정의 핵심 요소이지만 유일한 요소는 아니다. 판단과 데이터와 행동 등 결정을 내리는 데 필요한 다른 요소들은 아직까지도 여전한 인간의 영역이다. 이런 요소들은 예측에 대한 보완재여서, 예측의 비용이 내려가면 그 가치가 올라간다. 예를 들어 예측 기계가 이제는 더 좋고 더 빠르고 더 값싼 예측을 내놓기 때문에, 우리는 예전에 결정하지 않기로 결정했던 결정(예를 들어 원래 그런 것으로 인정되던 것)에 대해 판단을 내림으로써 기꺼운 마음으로 더욱 열심히 예측하려 들지도 모른다. 그럴 경우 인간의 판단에 대한 수요는 증가할 것이다.
판단의 가치
예측 기계는 예측 비용을 떨어뜨림으로써 행동과 관련된 보상을 이해하는 것의 가치를 증가시키기 때문에 판단에 대한 수익을 증가시킨다. 그러나 판단에는 비용이 든다. 다양한 상황에서의 다른 행동에 대한 상대적 득실을 따지기 위해서는 시간과 노력을 들여야 하고 또 실험도 해야 하기 때문이다. 예로 거래가 합법적이라고 생각해 승인하지만 틀릴 수 있고, 불확실한 상황에서는 옳은 결정뿐 아니라 잘못된 결정을 했을 때 그에 대한 득실을 따져야 한다. 이처럼 불확실성은 내려진 결정에 대한 득실을 판단하는 비용을 증가시킨다. 어떤 결정과 관련된 행동-상황 조합의 수가 감당할 수 있을 정도라면, 판단을 예측 기계에게 넘길 수 있다(이것이 ‘보상 기능 엔지니어링’이다). 그러면 기계는 예측을 해 스스로 결정한다. 그렇게 하면 결정을 자동화할 수 있다. 그러나 행동-상황의 조합이 너무 많아 모든 득실을 미리 코드화하기 어려울 정도로 비용이 많이 들 때가 있다. 흔하지 않은 조합일 때는 특히 그렇다. 이런 경우엔 예측 기계가 예측한 뒤에 인간이 판단하는 편이 더 효과적이다.
판단 예측
예측 기계는 인간의 판단을 예측하는 법을 배운다. 인간은 일어날 수 있는 모든 상황에서 자신이 내리는 판단을 코드화할 수 없지만, 우리는 자율주행 장치에 많은 사례를 보여 주고 인간이라면 이런 상황에서 어떻게 할 것인지 물어 인간의 판단을 예측하게 한 후, 그 예측에 대해 보상해 주는 방식으로 자율주행 장치를 훈련시킨다. 그런데 기계가 인간의 판단을 예측하는 데는 한계가 있고, 그 한계는 데이터 부족과 관련이 있다. 한편 개인의 선호도나 취향처럼 인간에게는 있는데 기계에는 없는 데이터가 있다. 그래서 기업들은 현재 고객카드의 포인트 적립과 구글이나 페이스북 같은 무료 온라인 서비스를 통해 그런 데이터에 접근하고 돈을 낸다.
복잡성 길들이기
많아진 ‘이프’ / 더 많은 ‘이프’와 더 많은 ‘덴’: 하드웨어든 소프트웨어든 모든 기계는 근본적으로 전형적인 이프-덴 논리에 따라 프로그래밍된다. ‘이프’ 부분은 어떤 시나리오나 환경적 상황이나 정보를 조건으로 지정한다. ‘덴’ 부분은 각각의 ‘이프’(그리고 ‘이프 낫(if nots)’과 ‘엘스(elses)’에 대해 기계가 해야 할 일을 일러 준다. 이런 식이다. “화학적 궤적이 더 이상 탐지되지 않으면 정지하라.”
예측 능력이 향상되면 인간이든 기계든 결정을 내리는 쪽은 ‘이프’와 ‘덴’을 더 많이 다룰 수 있다. 그러면 결과도 좋아진다. 예를 들어 우편배달 로봇의 경우, 예측 기계를 활용하면 통제된 환경에서만 운용하던 방식에서 벗어나 훨씬 더 자유롭게 움직일 수 있다. 통제된 환경의 특징은 ‘이프’ 또는 상태의 수가 제한되어 있다는 점이다. 예측 기계는 모든 잠재적 ‘이프’를 미리 코드화하지 않고 인간이라면 이런 상황에서 어떻게 하는지 예측하는 법을 배우기 때문에, 자율주행 차량도 시내 도로 같은 통제되지 않은 환경에서 운행할 수 있다.
완전자동화된 의사결정
가장 먼저 완전자동화될 가능성이 높은 과제는 완전자동화를 했을 경우 이득이 가장 높은 일이다. 여기에는 다음과 같은 경우가 포함된다. ① 예측을 제외한 다른 요소가 이미 자동화된 경우(광업 등). ② 예측에 대한 반응 속도가 빠를 때 이득이 높은 경우(운전자가 없는 자동차 등). ③ 예측에 필요한 대기 시간이 짧아졌을 때 이득이 높은 경우(우주 탐사 등).
같은 자율주행 차량이라도 도심에서 운행하는 경우와 광산에서 운행하는 경우의 중요한 차이는 전자가 유의미한 외부효과를 낳는 반면 후자는 그렇지 않다는 점이다. 시가지에서 운행되는 자율주행 차량이 사고를 일으킬 경우, 그 사고로 인한 비용은 의사결정자의 외부에 있는 사람이 부담하게 된다. 이와 달리 광산에서 운행하는 자율주행 차량에 의해 유발되는 사고는 광산과 관련된 자산이나 인력에 미치는 비용만 유발한다. 정부는 외부효과를 유발하는 활동은 규제한다. 그러므로 규제는 상당한 외부효과를 낳는 분야까지 완전자동화하는 데 장애물이 될 수 있다. 경제학자들은 외부효과를 내부화하는 방식으로 이런 문제를 해결하기 위해 책임 할당이라는 손쉬운 도구를 사용한다. 앞으로는 여러 새로운 분야에서 자동화에 대한 수요가 계속 증가하기 때문에 그로 인한 책임 할당과 관련해 유의미한 정책 개발이 활발하게 이루어져야 한다.
툴
워크플로 해체
인공지능을 현장에 적용할 수 있었던 것은 그에 맞는 툴이 개발되었기 때문이다. 인공지능 툴의 설계 단위는 ‘직무’나 ‘직업’이나 ‘전략’이 아니라 ‘과제’였다. 과제는 결정의 집합체다. 결정은 예측과 판단을 기반으로 하고 데이터에서 정보를 받는다. 하나의 과제 안에서 이루어지는 결정은 이런 요소들을 공유한다. 차이가 있다면 그 뒤의 행동이다. 예측 기계의 성장은 전 과정을 재설계하고 자동화하는 법과 우리가 워크플로라고 부르는 개념을 다시 생각해 볼 계기를 주어 해당 과제에서 인간을 완전히 효과적으로 배제할 것이다. 그러나 더 정확하고 값싼 예측만으로 자동화를 실현하기 위해서는, 과제의 다른 측면에 예측 기계를 사용했을 때에도 그에 대한 보상이 증가해야 한다.
인공지능 툴이 워크플로에 미치는 영향 / 인공지능 툴에 의해 강화된 아이폰 키보드: 인공지능 툴은 두 가지 방식으로 워크플로를 바꾼다. 첫째, 인공지능 툴은 과제 자체를 쓸모없게 만들어 워크플로에서 그 과제를 제거한다. 둘째, 인공지능 툴은 워크플로의 성격에 따라 새로운 과제를 추가하기도 한다. 한편 어떤 면에서 스마트폰의 키보드는 옛날 기계식 타자기와 공통점이 더 많다. 기계식 타자기를 사용해 본 연배의 사람이라면 키를 너무 빨리 누르는 바람에 활자 해머가 엉키는 경우를 여러 번 경험했을 것이다. 이런 이유 때문에 키보드는 쿼티(QWERTY) 자판 배열을 갖게 되었다. 이런 설계는 인접한 두 키를 동시에 두드릴 가능성을 줄여 타자기의 활자가 엉키지 않도록 하기 위한 것이다. 하지만 바로 이런 특징 때문에 유능한 타이피스트도 속도가 느려질 수밖에 없다.