Prisoner's  Dilemma

 

게임의 참여자인 두사람이 공범죄로 체포되어 분리된 방에서 심문을 받고 있다. 현명한 검사가 두 사람 각각에게 다음과 같이 말한다.

"두 사람 중에서 한 사람은 자백 (confess, 전략 A) 하고 다른 사람은 부인 (deny, 전략 B) 하면, 자백한 사람은 보상을 받고 (+1) 부인한 사람은 중벌에 처한다 (-2). 두 명 모두 자백하면 두 사람 모두를 경벌 (-1) 에 처한다. 두 명 모두 부인하면 (증거 불충분으로) 두 사람 모두 석방한다."

1950 년 (Dresher 와 Flood) 이후 이 게임은 죄수의 딜레마 (Prisoner's Dilemma) 로 알려졌고 사회과학에서 널리 연구되고 이용되어 왔다.

이 게임에서는 두 사람 모두에게 자백하는 것 B 가 우세전략이므로 (B, B) 가 유일한 평형점이 된다. 그러나 (B, B) 는 Pareto 최적이 아니고, 두 사람 모두에게 더 좋은 (A, A) 가 Pareto 최적이 된다. 위 상황의 관점에서 각 죄수는 다른 죄수가 무슨 선택을 하든지 상관하지 않고 자백하는 것이 유리하다. 하지만 죄수는 다른 죄수가 무슨 선택을 하든지 상환하지 않고 자백하는 것이 유리하다. 하지만 두 죄수가 모두 자백을 하게 되면 둘 다 자백을 하지 않을 때보다 나쁜 결과가 나오게 된다. 이것을 조심스럽게 생각해 보면, 우세의 원리의 형태로 된 개인적 이성주의 (individual rationality) 와 Pareto 의 원리의 형태로 된 집단적 이성주의 (group rationality) 가 불일치하게 된다. 자신의 가장 좋은 이익을 합리적으로 추구하는 개인들에게 결국에는 그들 각각에게 불행한 결과가 초래하게 된다 (합리성 (Rationality)).

죄수의 딜레마 모델의 중요성은 많은 사회현상이 근본적으로 이것과 비슷한 상황이라는 데 있다. 예를 들어, 두 개의 상점이 가격 경쟁을 하고 있는 경우를 상상해 보자. 한 상점이 가격을 낮추면, 그 상점은 상품당 이윤이 작아지지만 낮은 가격으로 더 많은 고객을 확보할 것이고, 가격을 내리지 않은 상점은 상품당 이윤은 크지만 고객이 줄어 매출 (또는 총이윤) 이 작아질 것이다. 그러므로 두 상점 모두 가격을 내리게 되어 모두가 보다 작은 이윤을 얻게 되고, 결국에는 두 상점 모두 가격을 내리지 않은 경우보다 이윤이 더 작게 된다. 두 국가간의 군비경쟁도 비슷한 경우이다. 각 국의 '무장' 과 '비무장' 이라는 두 개의 전략에 대하여 같은 이유로 설명이 가능하다.... (권오헌.윤태환 2000)

죄수의 딜레마는 비영합 게임 (non-zero-sum game) 의 일종이다. 게임 이론 (Game Theory) 문제에서, 다른 경우들처럼, 각자 플레이어는 다른 플레이어는 어찌되든간에 그 자신의 이득을 최대로 하려 한다고 가정한다. 이러한 Nash equilibrium 은 죄수의 딜레마에서 상호 적절한 해결책에 이르지 못한다 ; 평형상태에서, 각 죄수들은 서로 협력 (cooperate) 하면 보수 (payoff) 가 더 높아질 수 있지만 변절 (defect)을 선택한다. 각 죄수에게는 불행한 일이지만, 서로 협력을 약속한 이후에도 서로 속이기 위한 각자의 동기 (incentive)를 가지고 있다. 이것이 이 딜레마의 핵심이다.

죄수의 딜레마를 반복하면 평형의 결과로서 상호 협력이 발생할 수 있다. 게임은 계속 반복된다. 게임이 반복됨에 따라, 각 플레이어는 이전에 비협조적이었던 다른 플레이어에게 벌칙을 부여할 기회가 주어진다. 그럼으로써, 서로 속이게 만들었던 동기는 벌칙을 부여하겠다고 위협함으로써 극복되어, 더 나은 서로 협력하는 결과를 낳을 수 있다. ..... (Wikipedia : Prisoner's dilemma)

term :

죄수의 딜레마 (Prisoner's Dilemma)    John Nash    게임 이론 (Game Theory)    내시평형 (Nash Equilibrium)    경제학 (Economics)     Tragedy of the commons,  Tragedy of the anticommons,  합리성 (Rationality)   Superrationality,  Rendezvous problem,  Evolutionarily stable strategy,  Neuroeconomics,  세포 자동자 (Cellular Automata)

관련 인물 : John Nash     Nick Jennings   Graham Kendall   Robert Axelrod

site :

Wikipedia : Prisoner's dilemma)

Prisoner's dilemma game : Stanford

game theory : 용어 정의가 잘되어 있으며 죄수의 딜레마를 간결하고 정확하게 다루어 게임이론을 잘 소개한 문서

Repeated Prisoner's Dilemma Applet : Applet (collude : 서로 공모하다, cheat : 서로 속이다) ★★★ : 내가 collude or cheat를 선택하면 상대가 무엇을 선택하느냐에 따라 나와 상대가 (내가 왼쪽 값) 얼마 벌었는지 (earn) 가 표시된다.

New Tack Wins Prisoner's Dilemma

Prisoner's dilimma.com

paper :

죄수의 딜레마 : 권오헌. 윤태환

게임이론에서 본 한-미 통상관계 (The U.S.-South Korea Trade Relations in Terms of Game Theory) : 이상환, 한국세계지역학회, 2003