페르미 추정 두뇌 활용법
도쿄대학 케이스스터디 연구회 지음 | 에이지21
페르미 추정 두뇌 활용법
도쿄대학 케이스스터디 연구회 지음
에이지21 / 2011년 7월 / 192쪽 / 12,000원
PART 1 1000문제를 풀어보고 알았다! 페르미 추정의 6가지 유형과 5단계 해법
CHAPTER 01 페르미 추정의 기본 체계이 책의 목적은 페르미 추정 문제를 풀면서 논리적 사고, 가설 사고, 모델화, 정량화 등의 '사고 과정'을 습득하는 데 있다. 그러나 정작 페르미 추정 문제를 풀어보려 해도(예를 들어 '우리나라에 있는 전봇대 수가 몇 개일까?'), '어디서 시작해야 할지 모르겠다'는 사람이 많지 않을까? 그래서 우선 이 책에서는 페르미 추정 이론의 뼈대가 되는 '기본 체계'를 소개한다. 주어진 문제가 기본 체계 가운데 어느 유형에 해당하는지 파악하면 바로 해결의 실마리를 찾을 수 있기 때문이다.
예를 들어 '자동차 시장 규모의 증감은?'이라는 '유량 문제'의 응용문제를 살펴보자. 엄밀히 말하면, '시장 규모의 증감' 문제는 표의 기본 체계 안에 없다. 그렇지만 '유량 문제'의 '거시 매출 추정'(예, 자동차의 시장 규모는?)을 이해하면 '시장 규모의 증감' 문제를 푸는 단초를 얻을 수 있다. 즉, 여기서 제시하는 페르미 추정 '기본 체계'는 글자 그대로 '기본적인' 페르미 추정 문제를 망라하는 것이며, 한편으로 더 난이도 높은 응용문제를 풀기 위한 하나의 단계다.
저량 문제와 유량 문제
우선 페르미 추정 문제를 크게 둘로 나누는 '저량(貯量, stock)'과 '유량(流量, flow)'이라는 용어를 설명한다. 이해하기 쉽게 설명하면, '저량'이란 '어떤 물건의 특정 시점에서의 존재량'이고, '유량'은 '어떤 물건의 일정 기간 동안의 변화량'이다. 자동차를 예로 들어 구체적으로 생각하자. '자동차의 수'와 '자동차 시장 규모(연간)' 과연 어느 쪽이 '저량'이고, 어느 쪽이 '유량'일까? 답은 '자동차의 수'가 '저량'이고, '자동차 시장 규모(연간)'가 '유량'이다. 시장 규모(연간)는 1년이라는 일정 기간에 자동차가 판매된 양(금액)'이다. 물을 예로 들면, '저량'은 '용기 안에 있는 물의 양'이고, '유량'은 '일정기간에 수도꼭지에서 용기로 흘러들어온(혹은 용기에서 흘러나간) 물의 양'이다.
소유 접근법과 존재 접근법
소유 접근법과 존재 접근법의 정의: 페르미 추정 문제는 어떤 것을 단서로 하여, 즉 어떤 '기준(base)'을 정해 추정해야 한다. '소유 접근법'은 그런 단서가 '물건을 소유하고 있는 주체'인 경우이고, '존재 접근법'은 단서가 '물건이 존재하는 공간'인 경우이다. 바꿔 말하면, '소유 접근법'은 '누가 가지고 있는가?', '존재 접근법'은 '어디에 있는가?'라는 질문에서 출발한다. 예를 들어 '국내에 귀걸이가 몇 개 있을까?'라는 문제를 보자. '귀걸이'에서 무엇을 연상하는가? 페르미 추정에서는 '귀걸이' > '젊은 여성이 가지고 있는 귀걸이' > '개인'이라고 연상할 수 있다. 즉 '귀걸이'를 소유하고 있는 주체='개인'이라는 연상이다. 그리고 '개인'의 수를 기준으로 '국내의 귀걸이' 수를 구할 수 있다.
한편, '국내에 전봇대는 몇 개 있을까?'라는 문제를 보자. 자, 이번에는 '전봇대'에서 무엇을 연상하는가? '전봇대' > '집 주변에 늘어선 전봇대' > '집 주변의 면적' > '전봇대 하나당 면적'이라고 연상할 수 있다. 즉 '전봇대'가 존재하는 공간=일정한 '면적'을 연상한다. 그리고 전봇대 하나당 '면적'을 기준으로 '국내에 있는 전봇대' 수를 구할 수 있다. '소유 접근법'은 앞서 소개한 '개인 기준' 이외에도, 가구가 소유하고 있다고 보는 '가구 기준'이나 법인이 소유하고 있다고 보는 '법인 기준'도 있다. 또한 '존재 접근법'은 앞서 소개한 '면적 기준' 이외에 '단위 기준(unit base)'이라는 방법이 있다.
존재 접근법의 분류_ 면적 기준과 단위 기준: '존재 접근법'은 다시 '면적 기준'과 '단위 기준'으로 나눈다. '면적 기준'이란 '추상적인 공간'을 기준으로 하는 방법이고, '단위 기준'은 '구체적인 명칭이 있는 공간'(예, 도/광역시/시 같은 행정구역)이나 '구체적인 형체가 있는 공간'(예, 역)을 기준으로 하는 방법이다. '일본에는 평균 사방 50미터 공간에 전봇대가 하나씩 있다'고 가정해보자. 여기서 기준이 되는 '사방 50미터 면적'은 문제를 푸는 사람이 가정하는 추상적인 공간이기 때문에 '면적 기준'이다. 반면에 행정구역인 도도부현(일본에는 1도(도쿄), 1도(홋카이도), 2부(오사카, 교토), 43현이 있다-옮긴이)을 기준으로 일본에 있는 미술관 수를 구하는 경우를 보자. 기준이 되는 '도쿄도'나 '가나가와현'이라는 공간은 구체적인 명칭이 있는 현실 공간이다. 이 경우는 '각 도도부현에 평균 00개의 미술관이 있다'가 되므로 '단위 기준'이 된다. 이처럼 '존재 접근법'에서는 '추상적인 공간'을 기준으로 하는지, 아니면 도도부현 같은 '구체적인 공간'을 기준으로 하는지에 따라 해법이 다르다. 또한 '단위 기준'은 '공원'이나 '역'처럼 '구체적인 형체가 있는 공간'이 있다.
거시매출 추정과 미시매출 추정
다음으로 '유량 문제'에서 '거시매출 추정'과 '미시매출 추정'을 설명한다. 이 책에서는 '거시매출 추정' '시장 규모 추정'이고, '미시매출 추정' '단일 점포 내지 복수 점포의 매출 추정'이라고 한다. 즉, '거시매출 추정'이란 '규모가 큰' 매출이며, '미시매출 추정'이란 '규모가 작은' 매출이다. 따라서 '국내 시장 규모' > '규모가 크다' > '거시매출 추정'이고, '단일 점포 매출' > '규모가 작다' > '미시매출 추정'이다. 무엇보다 규모가 큰지 작은지는 상대적인 기준이라는 것에 유의해야 한다. 또한 이 책에서는 '유량 문제'를 '매출(금액)' 내지 '수량(개수)'으로 한정한다. 거시매출 추정과 미시매출 추정의 해법: 이 책에서는 아래의 해법을 추천한다.
'거시매출 추정' = '주로 수요 측면에서 추정한다'
'미시매출 추정' = '주로 공급 측면에서 추정한다'
여기서 '수요 측면'이란 '사는 쪽', '공급 측면'은 '파는 쪽'을 의미한다. '자동차 시장 규모'라는 '거시매출 추정' 문제를 생각해보자. '자동차 시장 규모'를 추정하는 경우, '공급 측면'에서 시장 규모를 구하는 것은 어렵다. 자동차를 파는 쪽을 국내 제조사와 해외 제조사로 분류해 주요 기업의 매출을 생각한다고 하더라도 그런 기업의 특징을 단시간에 정확하게 파악할 수 없다. 따라서 자동차 시장 규모를 추정하려면 결국 국내의 수요를 기준으로 해야 한다. 자동차 시장 규모 문제의 경우, 자동차 보유 주체인 '가구'를 기준으로 수치를 구하는 방법이 무난할 것이다. 즉, 자동차 시장 규모 같은 '거시매출 추정'에서는 '수요 측면', 다시 말해 '사는 쪽'에서 생각하는 편이 우리의 실제 감각에 맞다.
이번에는 '임의의 스타벅스 점포 한 곳의 매출'이라는 '미시매출 추정' 문제를 생각해보자. 임의의 스타벅스 점포 한 곳의 매출을 추정하는 경우에는 '공급 측면'에서 매출을 구하는 편이 우리의 실제 감각에 맞다. 스타벅스에 가본 적이 있다면, 스타벅스의 좌석 수, 영업 시간, 가동률, 회전율 등을 구체적으로 상상할 수 있다. 그리고 이 요소를 조합하여 식을 만들어 '임의의 스타벅스 점포 한 곳의 매출'을 구할 수 있다.
한편 '수요 측면'에서 '임의의 스타벅스 점포 한 곳의 매출'을 추정하기는 어렵다. 도쿄의 마루노우치에 위치한 스타벅스를 찾는 손님을 상상해보자. 마루노우치에 위치한 스타벅스를 찾는 손님은 외국인일 수도 있고 일본인이라도 관광객일 수도 있고, 학생일 수도 있고 회사원일 수도 있는 등 각 고객층이 어떤 사람이고, 언제 얼마나 살지 등의 특징을 파악하기 어렵다. 그렇다고 '수요 측면'에서 구하는 것이 불가능하다는 것은 아니다. 먼저, '커피숍 시장 규모'라는 '거시매출'을 구한 뒤, 스타벅스의 점유율을 일정한 비율(%)로 가정한다. 그리고 커피숍 시장 규모에 스타벅스 점유율을 곱하면 '스타벅스 기업 전체의 매출'이 나온다. 이렇게 얻은 수치를 점포 수로 나누면 어떻게든 '스타벅스 점포 하나의 매출'을 구할 수 있다. 하지만 이 경우 '마루노우치의 스타벅스' 같은 특정 점포의 매출이 아니라 ‘일반적인 스타벅스 점포의 평균매출’이라는 점을 유의해야 한다.
CHAPTER 02 페르미 추정의 기본 5단계기본 5단계 해설
페르미 추정은 기본적으로 다음 5단계로 진행한다.
1. 전제 인식, 2. 접근법 설정, 3. 모델화, 4. 계산 실행, 5. 현실성 검증
여기서는 '일본에 가방이 몇 개 있을까?'라는 문제를 예로 들어 5단계를 차례대로 설명한다.
1. 전제 인식: 전제 인식 단계에서는 '가방'을 어떻게 정의하는가(정의), 어떤 가방을 셀까(범위의 한정)를 결정해야 한다. 가방의 종류도 보스턴백 같이 큰 것부터 파우치처럼 가방이라고 해야 하는지 헷갈리는 것까지 다양하다. 소유자를 중심으로 봐도 상점에 진열되어 있는 '법인이 소유한 가방'과 고등학생이 학교에 가지고 다니는 '개인이 소유한 가방' 등이 있다. 따라서 처음에 '어떤 가방을 셀까'에 초점을 두고 가방을 정의하고 범위를 한정하지 않으면, 나중에 무엇을 세고 있는지 혼란스러워진다. 먼저 가방을 '정의'하고, 이어서 세는 '범위를 한정'해보자.
2. 접근법 설정: 다음으로 접근법 설정에서 기본 식을 만든다. 모델화 단계와의 차이를 감각적으로 설명하면, 접근법 설정은 '가로로 전개'하는 식을 생각하는 데 비해 모델화는 '세로로 분해'하는 식을 생각한다는 것이다. '일본에 가방이 몇 개 있을까?'라는 문제에서 '개인이 소유하고 있는 가방'으로 범위를 한정해 접근법을 설정하면, <일본에 있는 가방의 수=일본 인구 평균적으로 소유한 가방 수> 라는 식을 만들 수 있다.
또한 접근법 설정을 할 때는 '무엇을 기준으로 세는가'를 명확하게 해야 한다. 여기서 '기준'이란 위의 식을 만들 때 중심축이 되는 요소다. 흔히 사용하는 기준에는 '면적 기준'(예, 전봇대가 몇 개 있을까?), '개인 기준'(예, 귀걸이가 몇 개 있을까?), '가구 기준'(예, 자동차는 몇 대 있을까?)이 있다. '일본에 가방이 몇 개 있을까?'라는 문제는 일본 인구를 식에 대입시켜서 구하는 '개인 기준' 문제다. 그런데 이 식만으로는 가방 수가 시원하게 구해지지 않는다. 엄밀히 말하면, 수치는 구할 수 있지만 근거가 빈약한 가설을 기준으로 하는 엉성한 수치가 된다. 일본 인구는 1억 2천만 명이다. 일본 인구 문제는 해결했지만 일본인이 평균적으로 소유한 가방 수로 가면, '으음, 잘 모르겠지만 대략 2개!'라는 식으로 근거가 부족한 수치를 제시할 수밖에 없다. 따라서 확실한 근거에 기초한 수치를 제시하고, 더 정확한 식을 만들기 위해서는 모델화 과정이 필요하다.
3. 모델화: 모델화는 위의 식에 나온 일본 인구나 평균적으로 소유한 가방 수를 세로로 분해하는 것이다. 모델화 방법에는 여러 가지가 있는데 예를 들면,
일본 인구 평균적으로 소유한 가방 수
남녀 세대별 인구(0~80살) 각각의 집단이 평균적으로 소유한 가방 수
이처럼 일본 인구를 성별과 연령별(0~80세)로 분해하면, '여성은 남성보다 가방을 많이 가지고 있다', '10세 미만은 20세 이상에 비해 가방을 적게 가지고 있다' 등 각 집단이 평균적으로 소유한 가방 수를 구체적으로 상상할 수 있다. 여기에서 '구체적인 상상(직감)' 하나하나에 대해 '논리적인 근거'를 제시해야만 하는 건 아니다. '여성은 남성보다 가방을 많이 가지고 있다'라는 가정만 봐도 논리적으로 세세하게 분석하면 끝이 없다. '여성은 남성보다 패션에 관심이 많다' '패션으로 가방을 사서 만족감을 느끼는 경우가 더 많다' '여성은 남성보다 가방을 많이 가지고 있다' 등 적당히 하는 게 좋다. 즉, 가능한 정도로만 정확성을 담보하고, 듣는 사람이 납득할 만한 가설이라면 충분하다.
4. 계산 실행: 접근법 설정(가로로 전개)과 모델화(세로로 분해) 과정을 거쳐 세밀한 식을 만들고 나면, 각각의 요소에 수치를 대입할 수 있기에 이제 계산 실행 단계로 넘어간다. 계산 실행은 속도와 정확성을 요구한다. 계산은 항상 신속 정확하게 해야 하지만, 페르미 추정에서는 '어림수로 바꿔서 계산하는' 방법을 이용한다. 앞에 나온 '가방 수' 식에 수치를 대입한 결과, 750만(명) 47(개)라고 하는 계산식이 나왔다 하더라도 '계산에 시간이 걸리겠다' 혹은 '자칫 계산이 틀리겠다' 싶으면,
750만(명) 47(개) 750만(명) 50(개)=375만(명) 100(개)=3억7,500만(개)라고 계산해도 상관없다.페르미 추정의 원래 목적이 '100% 정확한 수치를 구하는' 것이 아니라 '수를 구하는 계산식을 만들고', '개략적인 수치를 빠른 시간에 구하는' 것이기 때문에 '어림수로 바꿔 계산'해도 된다.
5. 현실성 검증: 마지막 단계는 현실성 검증이다. 현실성 검증 단계는 앞 단계에서 자신이 설정한 계산식이 올바른지, 결과적으로 나온 수치가 정확한지 확인한다는 데 의미가 있다. 현실성을 검증해서 추정치가 실제 수치에 가까웠을 때 기쁨을 맛볼 수 있다. 전략 컨설팅회사 면접에서 페르미 추정 문제가 나왔을 때, 터무니없는 수치를 제시한다면(예, 일본에 있는 가방 수가 1조 개입니다 등) 어떻게 될까? 컨설팅 전문가에게 '수치가 조금 이상하지 않느냐?'고 날카롭게 추궁받을 것이다. 따라서 면접의 경우에도 현실성 검증 단계가 있다.
PART 2 6+1 유형의 핵심문제 15개로 지두력을 효율적으로 단련한다개인/가구 기준으로 저량(貯量)을 구하는 문제
예제 - 전국에 자동차는 몇 대 있을까?
전제 인식: 자동차에는 가정용(가구 소유)과 업무용(법인 소유)이 있지만 여기서는 가정용 자동차에 한정한다.
접근법 설정: 일본에 있는 자동차 수는, <가구수 평균 소유 비율 가구당 평균 소유 대수>로 구할 수 있다.
모델화: 다음으로 전체 가구를 구획으로 나누는 축을 생각한다. 먼저 '버스나 전철 같은 공공교통 시설의 정비 정도에 따라 자동차의 필요성이 달라지므로 도시와 시골이라는 축이 중요하다. 더욱이 차는 고가의 물건이기에 소유 비율과 소유 대수는 가구의 연간 수입에도 비례한다. 여기서는 가구의 연간 수입과 세대주의 연령 사이의 상관관계를 고려하여 도시와 시골 각각의 연령대별 소유 비율, 소유 대수를 다음과 같이 가정했다.
일본의 총 인구 1억 2,000만 명 중 도시와 시골의 인구 비율은 1:1로 가정한다. 가구별 구성원 수는 시골이 많다고 보고, 도시의 평균 가구 구성원 수를 2.5명, 시골의 평균 가구 구성원 수를 3.5명으로 가정하여 도시와 시골의 가구 수를 구해보면,
도시:6,000만(명) 2.5(가구별 구성원 수)=2,400만(가구)
시골:6,000만(명) 3.5(가구별 구성원 수)=1,700만(가구) 이 된다.
다음으로 세대주의 연령별 가구 비율을 살펴보자. 도시 쪽이 젊은 세대주가 많다고 가정하고 연령별로 가구 비율을 다음과 같이 가정했다.
계산 실행: 이제 준비가 끝났다. 예를 들어 도시의 20대 가구의 소유 대수는,
도시 가구 수 20대 가구 비율 평균 소유 비율 평균 소유 대수=2,400만(가구) 20% 10% 1(대)로 계산할 수 있다. 두 표를 이용하여 모든 세대에 대해 값을 계산하고, 모두 합치면 자가용 자동차 수가 나온다.
도시: 2,400만(가구) 20% 10% 1(대)