‘죄수의 딜레마’에 빠진 당신의 선택은?
창의적 문제해결 능력
창의적 문제해결 연습 /
‘게임이론’이라는 말을 들어본 적이 있는가?
죄수의 딜레마는 ‘수인의 딜레마’(prisoner’s dilemma)라고도 하는데, 게임이론의 하나다. 자세히 설명하자면, 다음과 같다.
공범 A와 B가 경찰에 붙잡혀 각각 격리된 상황에서 심문을 받는데, 두 사람 모두 두 가지 전략밖에 없다. 고백하거나, 고백하지 않거나.
그런데 두 사람 모두 고백하면 각각 10년형을 받게 된다. 만약 A는 고백하고 B는 입을 다물 경우 A는 특전을 받아 무죄로 풀려나고 B는 30년형을 받게 된다. 반대로 B가 고백하고 A가 입을 다물면 B는 무죄, A는 30년형을 받는다. 만약 A와 B가 모두 끝까지 입을 다물면 3일씩 구류를 살고 무죄로 풀려난다.
먼저, A의 처지를 생각해 보자. 자기가 고백하고 B도 고백하면 10년형이다. B는 고백했는데, 스스로 고백하지 않으면 30년형을 받게 되니 고백해야 한다는 결론이다. B가 고백하지 않았을 경우, 자기가 고백하면 당장 무죄로 풀리나, 입을 다물면 3일은 고생해야 한다. 따라서 A가 자기 이득만 생각한다면 B가 입을 다물더라도 고백해야 한다는 결론이다. B도 같은 이유로 자기 이득만을 위한다면 A가 고백하든 입을 다물든 고백해야 한다는 결론이다. 결국 A와 B가 자기 이득만을 위해 의사결정을 한다면 다 같이 고백하게 되어 각기 10년형을 받게 된다.
그러나 A와 B 모두를 위해서는 같이 입을 다물어 3일씩 구류를 받고 무죄로 나오는 더 좋은 전략이 있다. 바로 이를 ‘수인의 딜레마’라 한다. 즉, 각 개인이 자기의 이득만을 생각해 의사결정을 할 때, 사회 전체에 손실을 일으킬 수 있다는 게 이에 의해 설명되고 있다. 다시 말해 서로 좋은 합의점이 있지만 불확실성이 존재하기 때문에 자백을 할 수밖에 없다는 것이다.
여기 보니랑 클라이드라는 공범자 죄수가 있다. 이들에게 각각 자백을 하라는 제안을 하는데, 보니와 클라이드 모두 자백을 할 경우 각각 8년형을 받는다. 둘 다 모두 침묵할 경우에는 1년형을 받는다. 하지만 한 명은 침묵했는데, 다른 한 명이 자백을 할 경우, 자백한 사람은 석방, 침묵한 사람은 20년형을 받는다. 단, 공범자 죄수는 서로 만날 수 없다. 이 둘은 과연 몇 년 형을 받았을까. 위의 문제처럼 서로를 신뢰해 1년형을 받았을까?
■ 창의적 문제해결 연습 답안 플레이어로 형주와 경숙이가 있다고 가정하면 4가지 경우의 수가 생기는데, 각 플레이어의 선택과 상대편의 선택에 따라 서로 지급받는 당첨금이 아래와 같이 달라진다. 형주 A, 경숙 A ⇒ 형주 800원, 경숙 800원 형주 A, 경숙 B ⇒ 형주 100원, 경숙 900원 형주 B, 경숙 A ⇒ 형주 900원, 경숙 100원 형주 B, 경숙 B ⇒ 형주 200원, 경숙 200원 누굴 이기는 게 아니고 무엇을 선택하느냐에 따라 내가 받는 돈이 달라지는 것이다. 수학적으로 B를 선택하는 것이 A를 선택하는 것보다 언제나 100원을 더 받는다는 결과가 나온다. 흥미로운 것은 다음 라운드에 ‘상대편이 어느 것을 선택했는지’를 볼 수 있게 해주니까 처음에 B를 택하던 사람들도 후반이 되면 될수록 A를 택하기 시작했다는 결과가 나왔다. 전부 다 수학적으로 맞는 답인 B를 선택한다면 모두가 한번에 200원을 벌지만 모두가 서로 믿고 A를 선택한다면 전부가 800원씩 벌 수 있기 때문에 서로의 정보를 알고 있을 때에는 이기적이고 합리적인 사람은 A를 선택하게 되는 것이다. 여기서 논리의 오류는 전부 다 A를 택한다는 가정 아래서 나 혼자 B를 선택하는 게 가장 많은 돈을 버는 방법이라고 할 수 있다.
※ 매주 목요일 클래스온 누리집(www.class-on.com)에서는 문제 출제자가 직접 풀이한 동영상을 제공합니다. 문제에 대해 궁금한 점은 1644-0020으로 문의하면 됩니다.
대표강사 김상원
여기 보니랑 클라이드라는 공범자 죄수가 있다. 이들에게 각각 자백을 하라는 제안을 하는데, 보니와 클라이드 모두 자백을 할 경우 각각 8년형을 받는다. 둘 다 모두 침묵할 경우에는 1년형을 받는다. 하지만 한 명은 침묵했는데, 다른 한 명이 자백을 할 경우, 자백한 사람은 석방, 침묵한 사람은 20년형을 받는다. 단, 공범자 죄수는 서로 만날 수 없다. 이 둘은 과연 몇 년 형을 받았을까. 위의 문제처럼 서로를 신뢰해 1년형을 받았을까?
9
■ 창의적 문제해결 연습 답안 플레이어로 형주와 경숙이가 있다고 가정하면 4가지 경우의 수가 생기는데, 각 플레이어의 선택과 상대편의 선택에 따라 서로 지급받는 당첨금이 아래와 같이 달라진다. 형주 A, 경숙 A ⇒ 형주 800원, 경숙 800원 형주 A, 경숙 B ⇒ 형주 100원, 경숙 900원 형주 B, 경숙 A ⇒ 형주 900원, 경숙 100원 형주 B, 경숙 B ⇒ 형주 200원, 경숙 200원 누굴 이기는 게 아니고 무엇을 선택하느냐에 따라 내가 받는 돈이 달라지는 것이다. 수학적으로 B를 선택하는 것이 A를 선택하는 것보다 언제나 100원을 더 받는다는 결과가 나온다. 흥미로운 것은 다음 라운드에 ‘상대편이 어느 것을 선택했는지’를 볼 수 있게 해주니까 처음에 B를 택하던 사람들도 후반이 되면 될수록 A를 택하기 시작했다는 결과가 나왔다. 전부 다 수학적으로 맞는 답인 B를 선택한다면 모두가 한번에 200원을 벌지만 모두가 서로 믿고 A를 선택한다면 전부가 800원씩 벌 수 있기 때문에 서로의 정보를 알고 있을 때에는 이기적이고 합리적인 사람은 A를 선택하게 되는 것이다. 여기서 논리의 오류는 전부 다 A를 택한다는 가정 아래서 나 혼자 B를 선택하는 게 가장 많은 돈을 버는 방법이라고 할 수 있다.
대표강사 김상원
관련기사
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기