인생은 주사위 던지기가 아니다 (상)

류쉐펑 지음 | 미디어숲

인생은 주사위 던지기가 아니다 (상)

류쉐펑 지음

미디어숲 / 2026년 2월 / 288쪽 / 19,800원

Chapter 1 우리는 언제 어디서나 정보를 추론한다

셜록 홈스와 개발자 김 대리

우리는 일상에서 어떤 현상을 목격하면 그 이면에 숨겨진 정보를 추측하려는 경향이 있다. 이러한 사고 과정이 바로 ‘정보 추론’이다. 그렇다면 정보 추론은 왜 필요할까? 이유는 간단하다. 대부분의 경우 우리는 정보를 직접 눈으로 관찰할 수 없으므로, 그 정보가 겉으로 드러난 모습이나 현상을 바탕으로 추측할 수밖에 없기 때문이다.

셜록 홈스의 뛰어난 추론 능력: 우리에게 가장 익숙한 정보 추론의 고수를 꼽자면, 아마도 셜록 홈스가 떠오를 것이다. 영국 작가 코난 도일의 소설 『네 개의 서명』에는 셜록 홈스가 뛰어난 추론 능력을 발휘하여 정보를 밝혀내는 과정이 묘사되어 있다.

홈스는 친구 왓슨에게서 시계 하나를 건네받은 뒤, 그 시계를 한참 동안 살펴보았다. 그리고 홈스는 모든 추론을 종합하여 왓슨의 형에 대해 다음과 같이 결론을 내렸다. “자네 형님은 자유분방하고 방탕한 삶을 사는 분이네. 한때는 앞날이 기대되던 시절도 있었겠지. 하지만 자네 형님은 좋은 기회를 모두 놓쳐버렸고, 그로 인해 자주 궁핍한 생활에 시달렸을 걸세. 물론 어쩌다 가끔 형편이 좋아질 때도 있었겠지만, 결국 술에 찌들어 살다 생을 마감했을 가능성이 크네.” 놀랍게도 홈스가 내린 추론은 모두 사실이었다.

정보 추론은 실제로 다양한 직업에서 활용되고 있다. 예를 들어, 식물학자는 야외 조사 중 식물의 가지, 잎, 뿌리의 형태를 관찰하여 해당 식물의 종류를 정확히 판별한다. 수많은 과학 탐구 사례 역시 어떤 현상을 관찰한 뒤 그 이면에 숨겨진 원인을 찾아가는 정보 추론 과정에서 이뤄졌다. 가장 대표적인 예가 사과가 땅에 떨어지는 현상을 보고 만유인력을 추론해 낸 아이작 뉴턴의 일화다. 뉴턴은 이렇게 말했다. “사과는 왜 항상 수직으로 땅에 떨어질까? 어째서 위로 솟아오르거나 옆으로 뻗거나 혹은 기울어져 떨어지지 않는 걸까?” 영국의 과학자 제임스 왓슨과 프랜시스 크릭은 DNA의 X선 회절 사진을 보고 DNA의 이중 나선 구조를 추론해 냈다. 정보 추론은 결코 특정 전문가들만의 전유물이 아니다. 실제로 평범한 사람 누구나 일상에서 수없이 반복하며 자연스럽게 정보 추론을 하고 있다.

정보 추론의 어려움: 우리는 정보를 추론할 때 주로 목격한 현상을 바탕으로 그 속에 숨겨진 정보를 유추해 낸다. 여기서 목격한 현상은 흔히 겉모습, 관측 또는 결과라고 부르고, 그 속에 숨겨진 정보는 내적 요인, 본질 혹은 원인이라고 말한다. 사물이나 현상이 드러나는 과정은 안에서 바깥으로 향하는 ‘정방향 과정’이다. 즉, 내적 요인이 겉으로 드러나는 것, 본질이 관측 가능한 형태로 드러나는 것, 원인이 결과로 이어지는 흐름과 같다. 이러한 관점에서 보면 정보 추론은 바깥에서 안으로 향하는 ‘역방향 과정’이라 할 수 있다.

예를 들어 보자. 모든 질병은 특정한 증상을 나타낸다. 여기서 ‘질병’은 내적 요인이고, ‘증상’은 겉으로 드러난 모습이다. 의사가 환자의 병을 진단하는 과정이 바로 정보 추론의 전형적인 예라고 할 수 있다. 의사는 겉으로 드러난 증상을 바탕으로 환자가 앓고 있는 질병을 추론한다. 일반적으로 사물이나 현상의 내적 요인과 본질을 알고 있을 때, 그것이 어떤 형태나 모습으로 드러날지를 예측하기는 비교적 쉽다. 하지만 이와 반대로 겉으로 드러난 현상을 보고 그 이면의 원인을 추론하는 정보 추론 과정은 훨씬 더 어렵다.

<지자의린>이 주는 교훈

흑백 논리: 일상에서 종종 이런 대화를 들어 봤을 것이다.

“저 둘은 틀림없이 사귀고 있어. 퇴근할 때 두 사람이 같이 가는 걸 여러 번 봤거든.”

“회사 매출이 부진한 이유는 분명 제품 품질에 문제가 생겼기 때문일 거야.”

의도했든 아니든, 이들은 모두 ‘흑백 논리’로 정보를 추론하고 있다. 흑백 논리에 익숙한 사람은 ‘어떤 일이 일어난 원인은 오직 하나이며, 그 원인은 자신이 생각하는 바로 그 원인이다’라는 믿음을 무의식적으로 가지고 있다.

흑백 논리를 기반으로 정보를 추론하는 사람의 특징은 이렇다. 그들은 단 하나의 원인을 제시한 뒤, 그 원인을 뒷받침할 증거를 찾아 자신이 내린 결론을 정당화하려고 한다. 『한비자』에 수록된 <지자의린(아들은 지혜롭다고 칭찬하고 이웃은 도둑으로 의심한다)> 이야기를 살펴보자. 내용은 다음과 같다.

송나라에 어떤 부자가 있었다. 어느 날 비가 많이 내려 그 집의 담장이 무너졌다. 그 모습을 본 부자의 아들이 말했다. “담장을 고치지 않으면 분명 도둑이 들 것입니다.” 마침 지나가던 이웃집 노인도 같은 말을 건넸다. 그리고 그날 밤 부잣집에 정말로 도둑이 들어 많은 재물을 훔쳐 갔다. 부자는 담장을 고쳐야 한다고 말했던 아들은 지혜롭다고 칭찬하면서도, 같은 말을 했던 이웃집 노인은 도둑이 아닐지 의심했다.

이 부자의 사고방식이 바로 전형적인 흑백 논리에 의한 사고다. 많은 재물을 도둑맞은 뒤, 그의 머릿속에서는 다음과 같은 흐름으로 사고가 이어졌다.

(1) 나는 재물을 도둑맞았다. (목격한 현상)

(2) 아마도 이웃집 노인이 훔쳐 갔을 것이다. (한 가지 원인을 제시)

(3) 이전에 그 노인은 “담장을 고치지 않으면 도둑이 들 것이다.”라고 말했다. 이런 말을 내게 했다는 건, 애초에 그 노인이 우리 집 재물을 훔칠 마음을 먹고 있었던 게 아닐까? (증거 수집)

(4) 그 노인이 훔쳐 간 게 분명하다. (자신이 제시한 원인을 합리화)

현실 세계는 다양한 요소와 관점이 얽혀 있으므로 현실에서 일어나는 모든 상황을 흑백 논리로 바라보면 그 상황을 제대로 이해하거나 해결하기 어려울 수 있다.

확률적 사고: 흑백 논리와 대비되는 사고방식이 바로 ‘확률적 사고’다. 확률적 사고를 가진 사람은 다음과 같은 단계로 사고한다.

(1) 어떤 사건이나 현상을 목격한다.

(2) 가능성이 있는 모든 원인을 최대한 찾아본다.

(3) 관련이 있는 모든 증거를 최대한 수집한다.

(4) 수집한 증거를 바탕으로 가능성이 있다고 판단한 각 원인의 확률을 계산한다. 그리고 확률이 가장 큰 원인을 최종 원인으로 선택한다.

현실에서 벌어지는 일들은 ‘모 아니면 도’, ‘이것 아니면 저것’처럼 단순하게 구분되지 않는다. 왜냐하면 서로 다른 여러 원인이 하나의 사건을 초래할 수 있고, 수집한 증거가 불완전하거나 제한적일 때가 많아 사건의 원인을 100% 단정하기 어려운 경우가 많기 때문이다. 이럴 때 우리는 확률적 사고를 해야 한다. 먼저 가능성이 있는 모든 원인을 찾아내고, 그다음 수집한 증거를 바탕으로 각 원인이 사건을 일으켰을 확률을 계산한 뒤 가장 높은 확률을 가진 원인을 최종 결론으로 선택해야 한다. 공자는 무의(毋意), 무필(毋必), 무고(毋固), 무아(毋我)라는 가르침을 남겼다. 이는 억측하지 말고, 단정하지 말 것이며, 고집부리지 않고, 아집에 빠지지 말라는 뜻이다. 이 중에서도 확률적 사고와 가장 밀접한 의미를 지닌 것이 바로 ‘무필(단정하지 말라)’이다.

가장 잘 설명하는 것이 가장 가능성이 높은 것이다

조건부 확률: 확률은 많은 사람이 익숙하게 이해하고 있는 개념이다. 어떤 사건 A가 발생할 확률을 보통 P(A)로 나타내는데, P(A)는 0≤P(A)≤1인 값이다. 그리고 P(A)가 클수록 해당 사건이 발생할 가능성이 높음을 의미한다. 한편 조건부 확률은 말 그대로 어떤 특정 조건이 주어졌을 때 어떤 사건이 발생할 확률을 의미한다. 조건부 확률은 일반적으로 P(A|B)로 표현하며, 이는 ‘B가 일어날 경우에 A가 발생할 확률’을 의미한다. 쉽게 이해할 수 있는 예를 들어 보겠다. 도시에서는 출퇴근 시간에 교통 체증이 발생할 가능성이 매우 크다. 반면 점심시간에는 교통 체증이 발생할 가능성이 비교적 낮다. 이러한 현상은 다음과 같은 조건부 확률로 표현할 수 있다.

P(교통 체증 | 출퇴근시간) = 0.9

P(교통 체증 | 점심시간) = 0.2

첫 번째 식은 출퇴근 시간대에 차를 타고 나갔을 때 교통 체증을 겪을 확률이 0.9라는 의미다(즉, 평균적으로 10번 차를 타고 나가면 9번은 교통 체증이 발생한다는 뜻). 두 번째 식은 점심시간에 차를 타고 나갔을 때 교통 체증을 겪을 확률이 0.2라는 의미다(즉, 평균적으로 10번 차를 타고 나가면 2번 정도만 교통 체증이 발생한다는 뜻).

최대 우도법: 대다수의 사람은 어떤 현상을 보고 그 뒤에 숨겨진 원인을 추론하려고 할 때, 다음과 같은 방식으로 사고한다.

(1) 가능성이 있는 모든 원인을 나열한다.

(2) 각 원인이 해당 현상을 일으킬 확률을 계산한다.

(3) 확률이 가장 높은 원인을 최종 결론으로 선택한다.

어떤 현상을 일으킬 가능성이 있는 원인을 원인 1, 원인 2, 원인 3이라고 가정해 보자. 이 경우, 각각의 원인이 특정 현상을 일으킬 확률은 다음과 같은 조건부 확률 형태로 표현할 수 있다.

P(관측한 현상 | 원인 1), P(관측한 현상 | 원인 2), P(관측한 현상 | 원인 3)

여기서 원인 2에 해당하는 조건부 확률이 가장 클 경우 우리는 최종적으로 원인 2를 가장 가능성이 높은 원인으로 선택하게 될 것이다. 조건부 확률에서 조건에 해당하는 ‘원인’은 ‘|’의 오른쪽에 위치하고, ‘관측한 현상’이 ‘|’의 왼쪽에 위치한다. 그리고 특정 조건(원인)이 주어졌을 때 어떤 현상이 발생할 확률, 우리는 이것을 ‘우도(likelihood)’라고 부른다. 어떤 원인의 우도가 크다는 것은 그 원인이 존재할 때 그 현상을 목격할 가능성이 크다는 것을 의미한다. 우리는 우도가 가장 큰 원인, 즉 어떤 현상을 유발할 가능성이 제일 큰 원인을 관측된 현상을 초래한 근본 원인으로 선택한다. 그리고 이러한 방식을 ‘최대 우도법(Maximum Likelihood Estimation)’이라고 부른다.

우도 P(관측한 현상|원인 i)는 두 가지 의미로 해석할 수 있다. 하나는 원인 i가 존재하는 상황에서 해당 현상이 관측될 확률이고, 다른 하나는 원인 i가 관측된 현상을 초래한 원인으로서 얼마나 설득력이 있는지를 나타낸다. 즉, 우도가 클수록 해당 원인은 관측된 현상의 발생 이유를 더욱 논리적으로 설명할 수 있다. 결국 최대 우도법이란, 특정 현상이 발생한 경위를 가장 논리적으로 설명할 수 있는 원인을 최종 원인으로 선택하는 방식이라고 말할 수 있다.

누가 10점을 명중시켰을까?: 최대 우도법을 이해하기 위해 다음 예시를 보자.

당신의 취미가 사격이라고 가정해 보자. 어느 날 당신은 운 좋게 훈련장에서 공기소총 올림픽 챔피언과 마주쳤다. 당신은 그와 간단한 대화를 나눈 뒤, 같은 과녁을 향해 각각 한 발씩 쏘기로 했다. 사격을 마친 뒤 과녁을 확인하러 가보니, 10점 과녁에 총알 하나가 정확히 명중해 있었다. 그럼 이 10점 과녁을 맞힐 가능성이 더 높은 사람은 누구일까? 자, 현재까지 우리가 관측한 사실과 가능성이 있는 원인을 정리해 보자. 관측한 사실은 아주 간단하다. 당신과 올림픽 챔피언이 각각 한 발씩 쐈고, 총알 하나가 10점 과녁에 명중했다. 가능한 원인은 두 가지다. 당신이 쐈거나, 올림픽 챔피언이 쏜 것이다. 과거의 기록을 바탕으로 통계를 낸 결과, 다음과 같은 사실을 알게 되었다. 당신이 10점 과녁을 맞힐 확률은 10%(평균적으로 100번 쏘면 10번은 10점 과녁에 맞힌다)인 반면, 올림픽 챔피언이 10점 과녁을 맞힐 확률은 95%로 나타났다.

최대 우도법으로 분석해 보면, 관측한 현상(10점 과녁을 명중)은 올림픽 챔피언이 쏘았다고 가정했을 때 더 설득력 있게 설명된다. 즉, ‘올림픽 챔피언이 쐈다’는 가정(원인)이 10점을 명중한 결과와 더 잘 들어맞기 때문에, 올림픽 챔피언이 10점 과녁을 맞혔을 가능성이 더 높다고 판단할 수 있다.

Chapter 2 베이즈 정리

베이즈 정리와 그 수학적 논리

앞에서 우리는 정보를 추론할 때 ‘특정 현상이 관측된 이유를 해당 원인으로 얼마나 논리적으로 설명할 수 있는가’와 ‘그 원인이 실제로 맞을 확률’을 동시에 고려해야 한다는 점을 배웠다. 이것이 바로 ‘베이즈 추론’의 핵심 개념이다.

베이즈 정리의 탄생: 토머스 베이즈(Thomas Bayes)는 1701년에 런던에서 태어나 1761년에 세상을 떠났다. 그는 장로교 목사이자 아마추어 수학자였다. 베이즈가 세상을 떠난 뒤 그의 친구였던 리처드 프라이스가 베이즈의 「확률 이론의 특정 문제를 해결하기 위한 논문」을 정리해 발표했고, 이를 계기로 베이즈 이론이 확률 통계학의 중요한 이론으로 세상에 알려지게 되었다. 그럼 지금부터 베이즈가 후대에 남긴 ‘베이즈 정리(Bayes’ Theorem)’에 대해 알아보자. 베이즈 정리의 기본 형태는 다음과 같다.

P(A|B)= {P(A)P(B|A)}/P(B)

베이즈 정리는 조건부 확률을 계산하는 공식이다. 그러나 실제로 베이즈 정리는 어떤 현상 뒤에 숨겨진 원인을 찾는 데 가장 많이 활용된다. 즉, 베이즈 정리를 활용해 정보를 추론할 수 있다는 얘기다. 베이즈 정리를 이용한 정보 추론 역시 확률적 사고의 한 형태다.

정보 추론을 수학적으로 표현하기: 정보 추론이란 어떤 현상을 목격한 후 그 현상의 배후에 있는 가장 가능성 높은 원인을 찾는 과정이다. 여기서 ‘그 현상의 배후에 있는 가장 가능성 높은 원인’을 결정하는 과정은 두 단계로 나눌 수 있다. 첫째, 어떤 현상을 목격한 후, 그 현상을 초래했을 가능성이 있는 여러 원인의 확률을 계산한다. 둘째, 가장 높은 확률의 원인을 선택한다. 여기서 우리가 기억해야 할 것이 있다. ‘관측된 현상을 특정 원인이 초래했을 확률’은 조건부 확률이라는 것이다. 원인 i의 조건부 확률은 다음과 같은 형태로 정리할 수 있다.

P(원인 i|관측된 현상)

정리하자면 정보 추론의 핵심은 관측된 현상을 설명할 수 있는 여러 원인에 대해 각각의 조건부 확률을 계산하고, 그것들의 상대적인 크기를 비교하여 가장 가능성이 높은 원인을 판단하는 것이다. 여기서 중요하게 봐야 할 것이 있다. 바로 조건부 확률에서 조건에 해당하는 ‘관측된 현상’은 ‘|’ 기호 뒤에 위치하며, ‘원인 i’는 ‘|’ 기호 앞에 위치한다. 예를 들어, 가능성이 있는 원인이 두 가지이고 이 두 원인의 조건부 확률 중 (원인 1 | 관측된 현상 ) 보다 (원인 2 | 관측된 현상)가 더 클 경우 우리는 (원인 2 | 관측된 현상)을 최종 결론으로 선택하게 될 것이다.

최대 우도법을 수학적으로 표현하기: 최대 우도법은 먼저 각 원인의 우도를 계산한 다음, 우도가 가장 높은 원인을 선택하는 방법이다. 우도란, 어떤 원인이 발생했을 때 해당 현상이 관측될 확률을 의미하며 우도 역시 조건부 확률의 형태로 표현할 수 있다. 예를 들어 원인 i에 대한 우도는 P(관측된 현상|원인 i)로 표현한다.

정보 추론이 조건부 확률 P(원인 i|관측된 현상)을 기준으로 확률이 가장 큰 원인을 선택한다면, 최대 우도법은 조건부 확률 P(관측된 현상|원인 i)를 기준으로 확률이 가장 큰 원인을 선택한다. 자세히 보면, 이 두 조건부 확률은 ‘|’ 기호의 좌우가 정반대임을 알 수 있다. 따라서 최대 우도법은 ‘우도’를 이용해 조건부 확률 P(관측된 현상|원인 i)의 근삿값을 구하는 방법이라고도 볼 수 있다. 또 그렇기 때문에 최대 우도법은 특정 상황에서 잘못된 판단을 내릴 가능성이 존재한다.

전문 열람 제한

미가입 상태이므로 요약본의 일부만 제공됩니다.
더 깊이 있는 내일의 통찰력과 지식 에너지를
프리미엄 무제한 이용권으로 충전해 보세요!