승부에 강해지는 게임의 법칙

아이자와 아키라 지음 | 이다미디어

5. 룰을 바꾸어 승리한다6. 균형점을 승패에 활용한다7. 형세 역전의 지적 트릭제2부 상황별 게임이론 실천

신규시장에 참여하기오다 노부나가는 전국시대에 천하를 손에 쥐었다. 하지만 젊었을 때에는 오와리의 바보로 불렸다. 그가 처음으로 이름을 알리게 된 계기는 이마가와 요시모토와의 싸움이었다. 그 무렵 양쪽 군대의 병력은 오다의 군대가 2천여 명, 이마가와 군대가 4만여 명이었다. 절대적으로 오다의 군대가 열세인 싸움이었다. 당신은 이제 오다 노부나가이고, 당신의 부하가 보고하러 왔다. "노부나가님, 이마가와의 군대가 쳐들어왔습니다." "음…." "싸울까요? 아니면 도망칠까요?"

자, 당신은 어떤 대답을 할 것인가? 이 문제에 대해 전혀 생각해 보려고 하지 않거나, 역사적인 사실이라는 것만으로 '싸운다'를 선택한 사람은 게임이론에 소질이 없다고 볼 수 없다. 반대로 무슨 수로 4만 명의 이마가와 군대를 물리칠 것인가에 대해 생각하거나 이길 방법을 알고 싶다는 생각이 강한 사람은 게임이론에 소질이 있다.

게임이론의 기본은 '문제를 분해한다'는 데 있다. 먼저 복잡하고 거대한 문제를 작고 결단 가능한 문제로 분해해 나간다. 그리고 작은 문제 하나 하나에 대한 해답을 생각해 본다. 노부나가는 아무 대답도 하지 않았다. 말하지 않은 이유를 두 가지만 들면 첫째, 노부나가는 먼저 자신의 부하들의 각오를 관찰하려고 했다. 둘째, 자기 편 중에 적 스파이가 섞여 있을 가능성이 있다는 점이다. 싸울 의사가 없는 것처럼 가장하면 적을 속이는 효과를 기대할 수 있다. 그리고 노부나가가 선택한 공격법은 한밤중의 기습이었고 결국 승리를 쟁취했다.

'약자가 강자를 이긴다.' 이런 일은 오늘날 자주 일어난다. PC 산업의 거인 IBM은 2001년 세계 PC 시장 점유율에서 4위로 불과 6.2%를 차지하는 데 그쳤다. 왕년의 세계 최대 철강 메이커였던 US스틸도 예전의 영광을 누리지 못하고 있다. 벤처기업이나 중소기업이라 해도 대기업과의 경쟁에서 얼마든지 살아남을 수 있다는 것은 이제 상식에 속한다. 여기에서 약자가 강자는 이기는 방법이 바로 게임이론이다. 게임이론을 알면 승부에 강해진다. 그것은 비즈니스뿐만 아니라 생활에 있어서도 마찬가지이다. 인생 그 자체가 게임이기 때문이다.게임의 초심자는 이기려고만 한다. 하지만 진정으로 중요한 것은 '졌을 때의 손실을 줄이는 것'이다. 어려운 용어를 사용하면 '미니맥스 전략'이라고 한다. 곧 맥스(최대)의 손실을 미니(최소)화한다'는 것이 미니맥스 전략의 사고법이다. 가능한 한 패배를 줄이고, 패배의 피해를 작게 만드는 것은 게임이론에서 가장 중요한 비법이다. 그렇게 하는 것이 결국 얻을 수 있는 이익의 크기를 최대화시킬 수 있기 때문이다. 이것이 소극적이라고 생각하는가? A와 B가 싸운다. 이때 당신은 A이다. 양쪽 모두 '속공' 작전과 '지공' 작전 가운데 하나를 선택한다. 다음 표는 당신의 이익을 표시한다.

A / B 속공 지공

속공 1 2

지공 -1 3 이럴 때 당신은 미니맥스 전략으로 '속공'을 택해야 한다. 당신에게 최대한 주 어지는 이익은 3이지만 B에게는 어떤 경우에도 속공이 유리한 상황이기 때문이 다. 이 문제가 주는 것은 '적도 자신의 이익을 최대한 만들겠다고 생각한다'는 것이며, 그 결과 당신도 '손실을 적게 만드는 수단'을 선택하지 않으면 안 된다는 것이다. 미니맥스 전략을 사용하는 전형적인 상황은 '이익과 손실이 상대와 완전히 상쇄되어, 플러스 마이너스 제로'가 되는 경우이다. 이를 제로섬 게임이라고 한다. 표에서와 같이 자신에게 가장 유리한 수단은 좀처럼 사용할 수 없는 것이 제로섬 게임의 세계라고 할 수 있다. 하지만 모든 것에 미니맥스 전략을 사용해야 하는 것은 아님을 알아두자.

이 미니맥스 전략은 비즈니스에서 정말 중요한 개념이다. 여기서 핵심은 '우위에 있는 수단'을 찾는 것이다. 그런데 아무리 생각해도 우위가 없다면 어떻게 해야 할까? 실제 게임의 경우, 우위 수단이 존재하지 않는 것이 보통이다. 여기에서 '밀고 당기기'와 '작전'이 중요하게 된다. 즉, 상대가 이러면 자기는 이렇게 한다는 등의 밀고 당기기와 작전이 필요한 것이다.

타자 / 투수 직구를 던졌을 때 변화구를 던졌을 때

직구를 예상 80% 0%

변화구를 예상 10% 30%

하지만 위처럼 정해진 행동을 하는 것이 순수전략인 반면 '3회에 1번은 이렇게 하자'는 식으로 확률적으로 행동하는 것을 혼합전략이라고 한다. 이것을 편의상 확률전략이라고 부르겠다. 투수와 타자가 대결한다. 조건은 표와 같다. 이때 타자와 투수는 나름대로 대책을 세울 것이다. 각각의 최적확률은 무엇일까? 투수의 공 배합을 하나 하나 계산해보라(예. 공배합이 2:8일 경우, 직구예상 : 80%×0.2 + 0%×0.8=16%, 변화구예상 : 10%×0.2 + 30%×0.8=26%). 각각 따져보면 투수측은 직구 대 변화구를 3대 7로 던지는 것이 최적이고, 타자는 직구 대 변화구를 2대 8로 예측해서 배팅을 하는 것이 최적이다. 여기에 부조리가 있다. 투수가 3대 7 비율로 던지더라도 타자는 3대 7을 예상해서는 안 되는 것이다. 그렇게 던져도 자기는 2대 8로 예상해야 최적이라는 것인데, 잘못된 예상을 했을 때 타율은 최고가 된다니 참 기묘하다.당신이 A사의 주식을 1주에 1만 엔을 주고 샀다고 치자. 과거의 최고가는 2만 엔이었다. 그 후 가장 낮을 때는 400엔까지 떨어진 적도 있다. 현재 그 주식은 1주에 7,000엔이다. 당신은 이 가격에 매도할 용기가 있는가? 매도할 용기가 있다면 게임에 뛰어난 소질을 지닌 사람이다. 손해를 보아도 팔지 않으면 안 되는 상황이 있다. 그렇게 하지 않으면 더 큰 손실을 입을 수 있기 때문이다. 위 주식의 손실은 3할이다. 이는 곧 만회하기 쉬운 범위 내지만, 최저가였던 400엔까지 떨어지면 만회가 불가능하다. 종합적으로 판단하자면 위험한 주식이므로 즉각 매도하는 것이 타당한 것이다.

발상을 전환해 현재의 득점이 아니라 실점에 주목해 보라. 주식 투자에서 '손실을 적게 만든다'는 방침은 무엇보다 중요하다. 따라서 이것을 기본 중의 기본으로 삼고, 손실을 적게 만드는 것에서 출발해야 한다. 곧 이익보다는 손실에 주목하는 습관을 몸에 배게 해야 한다는 것이다. 두 번째는 손실을 비율로 생각해야 한다. 1,000엔의 주가가 750엔으로 떨어졌다. 그냥 놓아두니까 더욱 더 떨어져 500엔이 되었다. 2번에 걸친 주가 하락 중에 어느 것이 심각할까? 두 번째다. 처음의 하락은 1,000엔의 25%지만 나중의 하락은 750엔의 33%이다. 비율이라는 것을 염두에 두고 손실을 생각하는 것이 가능해진다면, 왜 손실을 억제하는 것이 중요한가를 쉽게 알 수 있다. 1,000엔의 주가가 700엔으로 떨어졌을 때 3할이 떨어진 것이지만 그 상태에서 다시 원래 1,000엔으로 회복하려면 43% 올라야 한다. 떨어지는 폭이 크면 필요한 상승폭이 극단적으로 커지게 된다. 따라서 아무리 손해를 보았다고 하더라도 중요한 일은 손실을 만회할 수 있는 가격대에서 팔아 버리는 손절매를 해야 한다는 것이다.

이를 근거로 투자의 불확실성을 대처하기 위해 흔히 거론되는 것이 '자산을 3등분하라'는 것이다. 예금과 유가증권, 부동산으로 3분해서 관리하는 것이다. 주식투자도 한 종목에 집중 투자하는 것보다는 여러 개의 종목에 분산 투자하는 것이 손실을 적게 내는 방법이다.죄수 A와 B가 체포되었다. 그들은 범죄 공모자로 의심받고 있다. 지금 두 사람은 구금된 채 서로 격리되어 있다. 그러므로 검사의 취조에 대해 상대가 어떻게 대응했는지 서로 알 수 없다. 검사가 두 사람에게 제시한 조건은 다음과 같다.

① 두 사람 모두 함구하면 징역 1년씩이다(가벼운 죄로 처벌해야 하기 때문이다).

② 두 사람 모두 자백하면 징역 2년씩이다(죄가 확정되기 때문이다).

③ 한 사람이 자백하고 다른 사람이 함구를 하면, 자백한 사람은 석방, 함구한 사람은 징역 3년이다.

당신은 어떤 선택을 내릴 것인가? 이것을 딜레마(이율배반 상태)라고 한다. 자신에게 유리하다고 생각한 선택안보다 손해라고 생각한 선택안이 훨씬 나을 수 있는 상태인 것이다. 이러한 죄수의 딜레마는 현실에도 존재한다. 경쟁자들 사이의 가격 경쟁이 그것이다. 자신이 먼저 가격을 내리면 이익이지만, 상대방이 먼저 내리면 손해다. 그렇다면 가격 현상유지를 해야 할까? 이것 또한 딜레마이다.

자, 이제 협조와 배반 가운데 어느 쪽이 우수한 선택이 되는지 알아보자. 로버트 액설로드라는 정치학자는 '컴퓨터 선수권'을 생각해 냈다. 이것은 콘테스트의 응모자들에게 컴퓨터 프로그램을 만들게 하여 서로 컴퓨터 상에서 싸우게 한 다음, 가장 강했던 프로그램의 전법을 죄수의 딜레마의 해결책으로 삼겠다는 것이다. 참가한 팀은 14팀이었다. 그리고 반반의 확률이 무작위로 나오는 랜덤이라는 프로그램을 추가해 15개 프로그램의 경연이 되었다. 또한 같은 프로그램끼리도 싸우는 것, 곧 자기 자신과의 싸움도 추가했다. 자, 결과는 어떻게 나왔을까?

우승한 프로그램은 심리학자 아나톨 래퍼포트라는 사람이 만든 '팃-포-탯'이었다. 이 프로그램은 도대체 몇 줄 정도의 프로그램이었을까? 놀라지 마시라. 단 4줄 짜리였다. 불과 4줄의 프로그램이 다른 14개의 프로그램을 이겨버린 것이다. 팃-포-탯의 전략은 '눈에는 눈, 이에는 이'였다. 팃-포-탯은 처음 협조로 시작하여, 상대가 협조면 다음 번에는 협조를, 배반이라면 다음 번에는 배반을 행하고 이것을 반복하는 프로그램이다.

어떻게 이런 단순한 프로그램이 우승할 수 있었던 것일까? 사실 팃-포-탯은 다른 프로그램과 근소한 점수차로 우승했다. 그리고 다른 프로그램과 대결했을 때 이기는 것보다는 지거나 비기는 것에 불과했다. 그런데 어떻게 우승을 했을까? 팃-포-탯은 이기지는 못했지만 최소한 졌을 때의 실점이 최소였다. 그래서 결과적으로 종합하면 최고의 성적을 거둔 것이다. 무관의 제왕, 즉 '미니맥스형' 전략이었다. 이것은 제2회 콘테스트에서도 마찬가지였다. 2회 대회에는 64개 팀에 랜덤까지 다시 출전했지만 역시 종합 우승은 팃-포-탯이었다. 39개의 프로그램과는 비기고, 나머지 24개의 프로그램에는 진 팃-포-탯은 최하위를 상대할 때도 많은 득점을 하지 못했다. 하지만 종합 점수로는 최고였다.

팃-포-탯은 평소에는 협조를 계속하는 무척 따분한 작전이다. 하지만 이것이 최선의 작전이다. '누구에게도 이기지 못하지만 종합해 보면 최고의 승자다'라는 것은 무서운 고등 전략이었던 것이다. 어쨌든 죄수의 딜레마에서 기본 해결책은 '협조'임이 분명해졌다. 이것을 절대 잊으면 안 된다.'죄수의 딜레마'의 전법은 패배주의라고 말할 수 있을 정도로 부정적인 인상을 주는 것이었다. 게임의 룰을 정한 채 싸우면 이런 일이 벌어지게 되는 것이다. 하지만 룰을 바꾸기 위한 아이디어를 짜낼 때, 상황은 종종 일변해 버린다. 투자가로 유명한 조지 소로스는 "게임의 룰이 바뀔 때가 크게 벌 수 있는 찬스"라고 계속해서 말해 왔다.

1962년 10월, 구 소련은 핵미사일을 쿠바로 가져왔다. 미국이 이것을 곧바로 탐지해 냈을 때, 세계는 핵전쟁의 위기에 직면했다. 이것을 겁쟁이와 강경으로 구분하여, 겹쟁이는 협조, 강경은 배반이라고 치자. 미국이 겁쟁이가 됐을 경우, 소련도 겁쟁이가 되면 제로섬이지만, 소련이 강경이 되면 소련이 1을 얻는다. 소련이 겁쟁이가 됐을 경우, 미국도 겁쟁이면 제로섬, 미국이 강경이면 미국이 1을 얻게 된다. 그리고 둘 모두 강경을 취하면 핵전쟁의 비참함을 고려하여 둘다 -100의 손실을 입는다. 자, 케네디는 어떤 노선을 취했을까?

결국 미국이 내린 선택은 '강경 노선'이었다. 왜 위험한 노선을 택했을까? 미국은 쌍방이 동시에 선택안을 고르는 '동시진행 게임'에서 순번에 따라 선택안을 고르는 '교대행동 게임'으로 룰을 바꾸었기 때문이다. 게임의 룰을 바꾼 케네디는 바로 선수를 쳤다. 미리 '강경'을 선언해 버린 것이다. 소련은 겁쟁이(-1)와 강경(-100) 가운데 하나를 선택할 수밖에 없었다. 한편으로 미국은 강하게만 밀어붙여 혼자 이기게 되면, 소련이 이를 납득할 리가 없다는 판단 하에 당시 소련의 지도자였던 흐루시초프가 자국 내의 강경파를 납득시킬 수 있는 '이익'을 제공해줬다. 미국이 준비한 카드는 터키에 있는 NATO(북대서양조약기구) 군의 미사일을 철거한다는 '거래 조건'이었다. 단, 소련의 적극적 정책 때문에 철거하는 게 아니라, 노후화에 대한 자발적 철거라는 조건을 붙임으로써 미국도 체면을 세웠다.

이와 같이 동시진행 게임에서 교대행동 게임으로 룰을 바꿈으로써 당신은 훨씬 더 유리하게 게임을 할 수 있다.게임에는 모럴이 필요하다게임이론을 현실에서 활용하면 어느 정도 자신이 이길 수 있는 것인지, 어느 정도 자신이 지는 것인지 꽤 높은 수준에서 미리 알 수 있다. 그리고 어느 지점으로부터는 벗어날 수 없는데, 그 지점이 '균형점'이 되는 게 기초적인 게임이론의 결론이다. 하지만 움직일 수 없는 균형점에서 머무르는 것도 별로 좋지 않다. 균형점을 타파하겠다는 생각이 현실에서는 필요하게 되기 때문이다.

앞서 말한 타자와 투수의 싸움에서, 타자의 타율은 2할 4푼으로 안정된다. 이미 말했던 것처럼 이런 상태를 '말안장 형상'이라고 하며, 이것을 '미니맥스'라고 불렀다. 올라가고 내려가는 어느 쪽도 모두 균형인 상태이다. 타자가 최적확률에서 벗어나면 투수는 공의 배합을 바꾸어 타율을 내리는 쪽으로 옮겨간다. 또한 투수가 최적확률로부터 벗어나면 타자는 예상을 바꾸어 타율을 올리는 쪽으로 옮겨간다. 이렇게 '서로 최고의 노력'을 하는 상태가 '균형점'을 형성하고 있다.

그리고 이런 균형 상태를 '내시균형'이라고 한다. 존 내시는 게임이론에 관한 공적으로 노벨경제학상을 수상했다. 내시균형은 게임이론에서 대표적인 개념의 하나이다. 내시균형이란 정확히 말하면 '자신 이외의 모든 플레이어가 균형점의 전략을 취할 때, 자신도 그것을 택하지 않으면 안 되는 상황'을 말한다. 단, 여기에서 주의할 점이 세 가지가 있다. 첫째, 한쪽만이 최고의 상태여서는 안 된다. 둘째, 자기 혼자만 벗어난다고 해도, 자신에게 득이 되지 않는 상황이다. 셋째, 자신이 벗어나면, 타인의 득점이 올라가는 것'이 보통이다.

하지만 내시균형은 결점이 많다. 죄수의 딜레마에 내시균형을 쓰면 '자백-자백'이 내시균형이다. 서로 최고의 노력을 한 결과인 '균형점'이 징역 1년의 '함구-함구'가 아니라 징역 2년의 '자백-자백'인 것이다. 이에 반해 파레토 최적이라는 개념이 있다. 파레토 최적은 내시균형처럼 '자신만'이 아니라 '전원의 상태를 움직여도 관계없는 조건' 하에서 최적의 상태를 구한다. 그리고 현재의 상태와 비교해 '자신의 이익을 늘리기 위해서는 타인의 이익을 줄일 수밖에 없다'는 상태가 되면 바로 파레토 최적이 되는 것이다. 이에 따라 죄수의 딜레마에서 파레토 최적은 '함구-함구'이다. 파레토 최적은 '전체적인 합리성'이라는 느낌의 개념인데, 이쪽이 개념적으로 우수해 보인다.

현재의 균형점을 빠져 나와 훨씬 더 이익을 늘리고 싶은 것은 누구나 바라는 일일 것이다. 자, 그러면 어떻게 하면 되겠는가. '죄수의 딜레마'의 경우, 서로 '배반' 상태라면 하나의 균형점이 되었다.

전문 열람 제한

미가입 상태이므로 요약본의 일부만 제공됩니다.
더 깊이 있는 내일의 통찰력과 지식 에너지를
프리미엄 무제한 이용권으로 충전해 보세요!