게임이론

그로비스 매니지먼트 인스티튜트 지음 | 21세기북스

제1장 1단계 게임으로 기본적인 개념을 이해한다

1. 죄수의 딜레마

포인트

죄수의 딜레마란 단 한 번의 1대1 동시게임에서 절대우위전략이 있는 경우, 각 플레이어가 절대우위전략을 선택하면 협력하는 것보다 더 나쁜 결과를 초래하는 것을 말한다.

* 죄수의 딜레마

공범인 강도 두 명이 체포되어 각각 독방에서 취조를 받는다. 두 사람 다 묵비권을 행사하면 1년형을 선고받는다. 그러나 둘 중 한 명이 자백하고 다른 한 사람이 묵비권을 행사한다면 자백한 사람은 무죄 방면되고, 묵비권을 행사한 사람은 20년형을 선고받게 된다. 두 사람 다 자백한다면 공범이 되어 각각 10년형을 선고받을 것이다. 이 경우 둘 다 묵비권을 행사해서 1년형을 선고받는 것이 합리적이지만 범인들 간에 서로 믿지 못하기 때문에 자백을 선택할 수밖에 없다는 것이 죄수의 딜레마이다.

케이스 : X모터스의 기술개발 위탁회사 선택

X모터스는 안전장치에 관한 기술개발을 위탁할 회사를 선택해야 한다. 앤더슨 사, 부시 사, 쿡 사, 돌 사가 후보인데 최종적으로 앤더슨 사나 부시 사 중 하나로 결정될 것이 틀림없다. 그러나 기술면에서 두 회사 모두 단독으로 성과를 내기가 힘들 것으로 판단하여 한 회사를 더 참여시킬 필요가 있는데 그 후보가 쿡 사와 돌 사이다. X모터스는 쿡 사와 돌 사에 앤더슨과 부시 중 어느 쪽을 지지할지 선택하라고 했다. 쿡 사와 돌 사는 담합이 가능하다. 선택에 따른 쿡 사와 돌 사의 예상 NPV(순현금흐름)은 다음과 같다.

① 두 회사 모두 앤더슨을 지지하면 쿡과 돌의 NPV은 각각 45억엔

② 두 회사 모두 부시를 지지하면 쿡과 돌의 NPV는 각각 37.5억엔

③ 쿡이 앤더슨을 돌이 부시를 지지하면 쿡의 NPV는 제로, 돌의 NPV는 50억 엔

④ 쿡이 부시를 돌이 앤더슨을 지지하면 쿡의 NPV는 50억 엔, 돌의 NPV는 제로

두 회사는 담합을 통해 앤더슨을 지지하는 방안을 고려하였으나 모두 상대가 배신할지도 모른다는 의심을 버리지 못하고 차선책으로 가장 피해가 적은 두 회사 모두 부시를 지지하는 둘째 방안을 선택하였다.

이론

이 케이스는 게임이론 중 가장 유명한 모델인 죄수의 딜레마를 응용한 것이다. 죄수의 딜레마 모델에서는 다른 플레이어가 어떤 행동을 취하든 간에 항상 일정한 행동을 선택하여 더 높은 이익을 얻는 전략인 절대우위전략을 사용한다. 절대우위전략이 존재하는 게임의 경우 해답은 하나인데 케이스에서는 두 회사 모두 부시를 지지하는 것이 해답이 된다. 죄수의 딜레마는 실제 비즈니스 세계에서 자주 발생하는 상황이다. 특히 서로가 1회 한정거래라는 것을 알고 있는 상태에서는 상대를 제치고 자신만 이기려는 유혹에 빠지기 쉽다. 이러한 상황에서는 상대의 배신에 대한 의심 때문에 서로가 적은 이익을 얻는 데 그친다는 것을 알면서도 절대우위전략을 선택하게 된다. 죄수의 딜레마 상황에서 더 높은 이익을 얻기 위해서는 첫째, 배신할 경우 벌칙을 부과하여 자신만 이익을 얻고자 하는 유혹을 억제하는 방법이 있고 둘째, 게임을 1회 이상 계속할 경우 상대를 배신하여 눈앞의 이익을 추구하는 것이 앞으로의 관계를 고려할 때 반드시 이익이라고 할 수 없도록 하는 방법이 있다. 일본 자동차 제조업체는 납품단가면에서 불리함을 감수하고 자사와 친분이 있는 부품공급업체와의 거래를 중시하는 거래관행이 있는데, 이는 반복적인 거래를 통해 부품공급업체의 배신으로 불량부품을 납품 받을 리스크를 암묵적으로 줄이는 것이다.

2. 내쉬균형과 남녀의 논쟁

포인트

내쉬균형(nash equilibrium)이란 모든 플레이어가 다른 플레이어가 취할 전략을 예상하고 그것을 전제로 자신이 취할 최선의 전략을 선택하는 상태를 말한다. 어떤 플레이어도 내쉬균형에 만족하는 전략들 이외의 다른 전략을 선택해서는 이익을 얻을 수 없기 때문에 안정상태가 유지된다.

케이스 : 두 은행의 합병 후 시스템 선정

A와 B은행의 정보시스템을 통합할 경우 A은행이 사용하고 있는 D시스템으로 통합한다면 A은행은 2억 엔의 수익을 기대할 수 있다. 반면 B은행은 1억 엔의 수익을 얻는 데 그칠 것이다. 반대로 B은행이 사용하고 있는 E시스템으로 통합한다면 A은행 수익은 1억 엔, B은행은 2억 엔이 될 것이다. 최악의 시나리오는 두 은행이 전혀 다른 시스템을 도입하는 것인데 이 경우 두 회사 모두 1억 엔의 손실을 예상한다. 시스템 통합으로 두 은행이 얻는 수익이 총 3억 엔일 때 최적의 시스템 선정 전략은?

이론

실제 비즈니스 세계에는 절대우위전략이 항상 존재하지 않지만 두 플레이어가 선택할 수 있는 최적전략이 존재하는데 이를 내쉬균형이라고 한다. 내쉬균형은 모든 플레이어가 다른 플레이어의 전략을 전제로 최적의 전략을 선택하는 상태를 말한다. 각 플레이어들은 다른 전략을 선택하면 더 낮은 이익을 얻기 때문에 현재 상태에 머물게 되는데 이것을 내쉬균형이라고 표현한다. 위의 케이스에서 두 은행은 [D시스템, D시스템]과 [E시스템, E시스템]의 내쉬균형에 도달하게 된다. 보통 내쉬균형전략은 2개 이상 존재한다. 남녀의 논쟁(battle of the sexes)게임은 남녀가 데이트를 위해 오페라와 복싱 중 어느 것을 보러 갈 것인지를 결정하는 것인데 여기서는 [복싱, 복싱]과 [오페라, 오페라] 두개의 전략 조합이 내쉬균형을 만족하고 있다.

게임이론에서 내쉬균형은 중요한 개념이지만 내쉬균형에 도달하는 방법은 명확하지 않다. 케이스에서 두 은행이 사전에 협의할 수 없고 상대가 어떤 전략을 선택할 지 알 수 없는 상태에서는 내쉬균형에 만족하는 전략을 선택할 수 없다. 상대의 전략을 예상하려면 별도의 정보가 필요한데 정보가 없으면 내쉬균형 전략 이외의 전략을 선택할지도 모른다는 두려움이 생기게 된다. 내쉬균형 전략은 절대우위전략과 비교하여 각 플레이어의 행동을 분석하는 개념으로는 명확하지 않다. 이런 점은 하나의 게임에 내쉬균형 전략이 여러 개 존재하거나 여러 플레이어가 게임을 할 때 더욱 증폭된다. 플레이어들이 모두 동일한 전략을 사용하면 이익이 늘어나지만 단 한 명이라도 다른 전략을 선택하면 이익이 줄어드는 상황은 실제 비즈니스 현장에서 많이 경험할 수 있다. PC에서의 IBM호환기종과 맥킨토시 규격경쟁이 그 대표적인 예이다. 디팩토 스탠더드(defacto standard, 실질적 표준)도 실제로는 일종의 내쉬균형 상황인데 예를 들어 PC운영체제인 마이크로 소프트의 윈도우가 시장에서 사실상 표준으로 쓰이고 있기 때문에 소비자들이 다른 규격을 사용할 경우 이익을 보지 못하는 것이다.

3. 동전 던지기 게임과 혼합전략

포인트

순수내쉬균형전략이 존재하지 않는 게임에서도 자신이 선택할 수 있는 전략을 무작위로 정할 수 있다. 상대가 어떤 전략을 선택하든 간에 자신의 이익이 변하지 않는 상황을 혼합내쉬균형전략이라고 한다.

케이스 : 신문의 시장점유율 경쟁

신문사 B포스트와 B나우는 매출점유율이 각각 40%, 60%를 차지하고 있는데 1면의 특집기사에 따라 점유율에 변화가 있다. B포스트는 과거 데이터를 분석한 결과 B나우 1면에 정치사회에 관한 기사가 실렸을 때 B포스트도 같은 주제의 기사를 쓰면 60%의 점유율을 획득하고, B나우 1면에 예능스포츠 기사를 실을 때에 같은 주제의 기사를 쓰면 40%를 점유한다는 사실을 알았다. 반면 특집기사의 주제가 다른 경우, 즉 B나우가 정치사회일 때 B포스트가 예능스포츠이면 30% 점유율, B나우가 예능스포츠 일 때 B포스트가 정치사회이면 20% 점유율을 보였다. B포스트는 기대치가 최대가 되도록 행동을 조합하기로 하고 계산한 결과 B포스트가 1면에 20% 비중으로 정치사회기사를 싣는다면 B나우가 어떤 비율로 조합하든지 간에 장기적으로 B포스트는 36%의 점유율을 얻게 된다는 결론을 얻었다.

이론

순수전략이 존재하지 않는 내쉬균형게임의 경우에는 혼합전략을 사용한다. 순수전략이 존재하지 않는 내쉬균형 게임의 예로 동전던지기가 있다. 동전던지기 게임에서 최상의 전략은 자신이 앞면과 뒷면을 내는 비율이 들키지 않도록 적절하게 무작위로 내는 것이다. 이처럼 순수전략을 취하지 않고 일정한 확률에 따라 무작위로 선택하는 전략을 혼합전략이라고 한다. 게임이론에서는 다른 플레이어가 현재의 확률로 무작위로 나온다는 전제가 있는 이상 아무리 자기 혼자 무작위화 확률을 변경해도 자신의 이익을 늘릴 수 없는 상태를 균형상태라고 설명하고 있다. 이것을 혼합내쉬균형전략이라고 하는데 자신만 무작위화 확률을 바꾼다고 기대이익을 늘릴 수 없기 때문에 이런 의미에서 내쉬균형의 조건이 충족되고 균형상태가 유지되는 것으로 간주한다.

케이스에서 B포스트가 [정치사회기사 20%, 예능스포츠기사 80%]로 무작위화 하여 특집기사를 조합하고, B나우가 [정치사회기사 40%, 예능스포츠기사 60%]로 무작위화 하여 특집기사를 조합하면 B포스트의 점유율은 36%, B나우의 점유율은 64%로 귀결된다. 그렇게 되는 이유는 B포스트와 B나우가 서로 '정치사회'와 '예능스포츠'라는 1면 특집기사를 각각 P와 Q의 확률로 무작위로 낼 경우 B포스트는 B나우가 어떤 확률 Q로 무작위화 하더라도 B나우가 기대이익을 늘리지 못하는 P를 선택하기 때문이다. B나우가 '정치사회'를 선택할 경우와 '예능스포츠'를 선택할 경우의 기대이익이 같아지도록 B포스트가 무작위화 하면 P=0.2가 되며 이때 B나우의 기대이익의 합계는 64%가 된다. 동일한 방법으로 계산하면 B포스트의 기대이익의 합계는 36%가 된다.

혼합전략에서 두 플레이어간의 균형으로 얻는 이익은 순수전략의 이익보다 줄어드는데 복수의 균형전략이 존재하는 경우 다른 균형전략에 비해 이익이 적은 균형전략을 이익열위전략이라고 한다. 또한 혼합전략에서 얻을 수 있는 기대이익은 순수전략에서 얻을 수 있는 기대이익과 달리 어느 플레이어나 동일한 값을 가진다. 이처럼 플레이어의 기대이익이 동일해 지는 것을 대칭균형이라고 한다. 복수의 균형전략이 존재하는 게임에서 이익열위나 대칭균형 모두 선택기준이 되는데 앞에서 제시된 Case에서 은행들이 동일한 이익을 목적으로 한다면 대칭균형의 조건에 만족하는 혼합내쉬균형전략을 선택할 것이고 균형을 무너뜨리고 좀 더 높은 이익을 노린다면 두 개의 순수내쉬균형전략 중에서 어느 한쪽을 택할 것이다. 혼합전략을 제비뽑기 전략이라고 생각하면 플레이어가 늘어날수록 바람직한 결과가 나올 확률은 그만큼 줄어든다. 따라서 사전에 각 플레이어의 이해관계를 조정하여 당사자들이 무작위로 시스템을 선택함으로써 이익열위에 빠지는 것을 방지하고 각 플레이어들이 최대이익을 얻을 수 있는 순수내쉬균형전략을 선택하도록 이끌어야 한다.

제2장 다단계 게임으로 응용력을 연마한다

1. 순차게임과 부분게임 완전균형

포인트

순차게임의 특징은 먼저 행동을 취하는 플레이어의 전략을 확인한 후에 다음에 행동할 플레이어가 자신의 전략을 선택하는 것이다. 따라서 상대의 행동이 새로운 정보가 되어 자신이 행동에 영향을 미친다.

케이스 : 거래비중 확대를 위한 딜레마

운송업체 I사의 야마토 씨는 K제작소의 사가와 부장에게 I사에서 K제작소의 계열사인 J운수보다 저렴한 요금으로 배송해 준다면 K제작소가 J운수에 맡기고 있는 물량 일부를 I사에 넘길 것이라는 제의를 받았다. 현재 K제작소와의 거래상황을 알아보니 I사는 1개월에 100만 엔, J운수는 500만 엔의 이익을 올리고 있었다. 사가와 부장의 제의를 받아들일 경우 I사의 이익은 매달 200만 엔으로 늘어나고 J운수의 이익은 그만큼 줄어든다. 야마토 씨가 걱정하는 것은 J운수의 반격가능성이다. J운수는 거래량을 유지하기 위해 이익이 거의 남지 않는 선까지 단가를 내릴 가능성이 있으며 그렇게 되면 가격경쟁이 발생하여 양사의 이익이 거의 제로에 가까운 수준으로 떨어질지도 모른다. 야마토 씨는 어떻게 해야 할 것인가?

이론

제1장에서는 플레이어가 동시에 전략을 단 한번 선택하는 게임모델(단기간 동시게임)을 다루었지만 실제 비즈니스 세계에서는 동시게임만 있는 상황은 존재하지 않는다. 플레이어의 행동이 복수의 상황(시계열)에서 행해지는 것을 다단계게임이라고 하는데 다단계 게임 중에서도 상대의 행동을 보면서 순서에 따라 행동하는 게임을 순차적 게임이라고 한다. 순차게임을 정리하는 데는 게임트리를 이용한다. 게임트리를 만드는 방법은 각 플레이어가 행동을 취하는 지점에 분기점을 그리고 각 분기점에서 경로를 화살표로 그려 해당 플레이어가 취할 수 있는 행동을 적는다. 각 경로의 종착점에는 그곳에 도달했을 경우에 각 플레이어가 얻는 이익을 기재한다. 게임트리를 완성한 후에는 부분게임이라는 개념을 도입한다. 순차게임의 일부인 부분게임은 '어떤 한 부분만을 꺼내서 그것을 하나의 독립된 게임으로 분석하는 게임'을 말한다. 부분게임에서는 후방귀납법을 사용하여 각 플레이어가 선택하는 전략을 살펴볼 수 있는데 후방귀납법은 맨 마지막 분기점을 기준으로 하는 부분게임에서 플레이어가 어떤 전략을 선택할 지를 분석하고 선택했을 때 얻는 이익을 전제로 그곳에서부터 앞의 분기점(부분게임)으로 거슬러 올라가 어떤 전략을 선택할지를 선택하는 법이다. 후방귀납법을 이용한 결과 모든 부분게임에서 각 플레이어는 내쉬균형전략을 선택하고 있는데 이러한 전략조합을 부분게임완전균형(subgame perfect equilibrium)이라고 한다.

[게임트리 도표] - 문서내용 참고

순차게임에서는 앞선 플레이어의 행동이 새로운 정보가 된다. 실제 비즈니스에서도 '경쟁상대가 판매가를 내렸다'와 같은 새로운 정보는 자사의 전략에 영향을 미친다. 순차게임이론은 실제 비즈니스에서 본능적으로 많이 행해지고 있는 순차게임을 자사의 전략으로 검토하는데 도움이 된다. 배신할게 뻔한 약속이나 의도가 보이는 위협 같은 '신빙성에 문제가 있는 전략'은 상대의 행동에 영향을 미칠 수 없다. 이러한 상황을 타개하는 방법은 상대방의 행동을 모르는 것처럼 행동하여 순차게임을 동시게임으로 바꾸거나 게임의 순서를 바꾸는 것이다. Case에서 게임의 순서를 바꿔 J운수가 먼저 가격을 내린다면 I사는 더욱 낮은 가격을 제시해야 하고 결국 이익이 나지 않기 때문에 I사는 결국 거래를 포기할 것이라고 예상할 수 있다.

2. 유한반복게임

포인트

같은 게임이 여러 번 반복되는 것으로 1회 한정게임에서 볼 수 없는 협력적인 행동이 나타난다. 마지막 횟수(최종회)가 있는 경우 후방귀납법을 이용하여 그 결과로부터 각 부분게임의 이익을 알 수 있다. 또한 반복게임에서 협력관계를 유지하게 하는 것은 배신에 대한 다른 플레이어의 보복위협이다.

케이스 : 바겐세일 전략

X마을 같은 상점가에 Y옷가게와 Z옷가게가 있다. 옷가게 주인의 가장 큰 문제는 여름과 겨울 두 차례 바겐 시즌 기간에 세일을 할 것인지 여부를 결정하는 것이다. 과거 경험에 의하면 양쪽 모두 세일을 하지 않을 경우 두 가게는 각각 200만 엔의 이익을 본다. 어느 한쪽이 세일을 하는 경우 세일한 쪽은 300만 엔의 이익을 보지만 다른 한쪽은 이익이 제로가 된다. 양쪽 모두 세일을 할 경우에는 이익률이 낮아져서 각각 100만 엔의 적자가 발생한다. 최근에 아버지로부터 옷가게를 물려받은 Y옷가

전문 열람 제한

미가입 상태이므로 요약본의 일부만 제공됩니다.
더 깊이 있는 내일의 통찰력과 지식 에너지를
프리미엄 무제한 이용권으로 충전해 보세요!