Prisoner's  Dilemma

 

°ÔÀÓÀÇ Âü¿©ÀÚÀÎ µÎ»ç¶÷ÀÌ °ø¹üÁ˷ΠüÆ÷µÇ¾î ºÐ¸®µÈ ¹æ¿¡¼­ ½É¹®À» ¹Þ°í ÀÖ´Ù. Çö¸íÇÑ °Ë»ç°¡ µÎ »ç¶÷ °¢°¢¿¡°Ô ´ÙÀ½°ú °°ÀÌ ¸»ÇÑ´Ù.

"µÎ »ç¶÷ Áß¿¡¼­ ÇÑ »ç¶÷Àº ÀÚ¹é (confess, Àü·« A) ÇÏ°í ´Ù¸¥ »ç¶÷Àº ºÎÀÎ (deny, Àü·« B) Çϸé, ÀÚ¹éÇÑ »ç¶÷Àº º¸»óÀ» ¹Þ°í (+1) ºÎÀÎÇÑ »ç¶÷Àº Áß¹ú¿¡ óÇÑ´Ù (-2). µÎ ¸í ¸ðµÎ ÀÚ¹éÇÏ¸é µÎ »ç¶÷ ¸ðµÎ¸¦ °æ¹ú (-1) ¿¡ óÇÑ´Ù. µÎ ¸í ¸ðµÎ ºÎÀÎÇϸé (Áõ°Å ºÒÃæºÐÀ¸·Î) µÎ »ç¶÷ ¸ðµÎ ¼®¹æÇÑ´Ù."

1950 ³â (Dresher ¿Í Flood) ÀÌÈÄ ÀÌ °ÔÀÓÀº Á˼öÀÇ µô·¹¸¶ (Prisoner's Dilemma) ·Î ¾Ë·ÁÁ³°í »çȸ°úÇп¡¼­ ³Î¸® ¿¬±¸µÇ°í ÀÌ¿ëµÇ¾î ¿Ô´Ù.

ÀÌ °ÔÀÓ¿¡¼­´Â µÎ »ç¶÷ ¸ðµÎ¿¡°Ô ÀÚ¹éÇÏ´Â °Í B °¡ ¿ì¼¼Àü·«À̹ǷΠ(B, B) °¡ À¯ÀÏÇÑ ÆòÇüÁ¡ÀÌ µÈ´Ù. ±×·¯³ª (B, B) ´Â Pareto ÃÖÀûÀÌ ¾Æ´Ï°í, µÎ »ç¶÷ ¸ðµÎ¿¡°Ô ´õ ÁÁÀº (A, A) °¡ Pareto ÃÖÀûÀÌ µÈ´Ù. À§ »óȲÀÇ °üÁ¡¿¡¼­ °¢ Á˼ö´Â ´Ù¸¥ Á˼ö°¡ ¹«½¼ ¼±ÅÃÀ» ÇϵçÁö »ó°üÇÏÁö ¾Ê°í ÀÚ¹éÇÏ´Â °ÍÀÌ À¯¸®ÇÏ´Ù. ÇÏÁö¸¸ Á˼ö´Â ´Ù¸¥ Á˼ö°¡ ¹«½¼ ¼±ÅÃÀ» ÇϵçÁö »óȯÇÏÁö ¾Ê°í ÀÚ¹éÇÏ´Â °ÍÀÌ À¯¸®ÇÏ´Ù. ÇÏÁö¸¸ µÎ Á˼ö°¡ ¸ðµÎ ÀÚ¹éÀ» ÇÏ°Ô µÇ¸é µÑ ´Ù ÀÚ¹éÀ» ÇÏÁö ¾ÊÀ» ¶§º¸´Ù ³ª»Û °á°ú°¡ ³ª¿À°Ô µÈ´Ù. ÀÌ°ÍÀ» Á¶½É½º·´°Ô »ý°¢ÇØ º¸¸é, ¿ì¼¼ÀÇ ¿ø¸®ÀÇ ÇüÅ·ΠµÈ °³ÀÎÀû À̼ºÁÖÀÇ (individual rationality) ¿Í Pareto ÀÇ ¿ø¸®ÀÇ ÇüÅ·ΠµÈ Áý´ÜÀû À̼ºÁÖÀÇ (group rationality) °¡ ºÒÀÏÄ¡ÇÏ°Ô µÈ´Ù. ÀÚ½ÅÀÇ °¡Àå ÁÁÀº ÀÌÀÍÀ» ÇÕ¸®ÀûÀ¸·Î Ãß±¸ÇÏ´Â °³Àε鿡°Ô °á±¹¿¡´Â ±×µé °¢°¢¿¡°Ô ºÒÇàÇÑ °á°ú°¡ ÃÊ·¡ÇÏ°Ô µÈ´Ù (ÇÕ¸®¼º (Rationality)).

Á˼öÀÇ µô·¹¸¶ ¸ðµ¨ÀÇ Á߿伺Àº ¸¹Àº »çȸÇö»óÀÌ ±Ùº»ÀûÀ¸·Î ÀÌ°Í°ú ºñ½ÁÇÑ »óȲÀ̶ó´Â µ¥ ÀÖ´Ù. ¿¹¸¦ µé¾î, µÎ °³ÀÇ »óÁ¡ÀÌ °¡°Ý °æÀïÀ» ÇÏ°í ÀÖ´Â °æ¿ì¸¦ »ó»óÇØ º¸ÀÚ. ÇÑ »óÁ¡ÀÌ °¡°ÝÀ» ³·Ã߸é, ±× »óÁ¡Àº »óÇ°´ç ÀÌÀ±ÀÌ ÀÛ¾ÆÁöÁö¸¸ ³·Àº °¡°ÝÀ¸·Î ´õ ¸¹Àº °í°´À» È®º¸ÇÒ °ÍÀÌ°í, °¡°ÝÀ» ³»¸®Áö ¾ÊÀº »óÁ¡Àº »óÇ°´ç ÀÌÀ±Àº Å©Áö¸¸ °í°´ÀÌ ÁÙ¾î ¸ÅÃâ (¶Ç´Â ÃÑÀÌÀ±) ÀÌ ÀÛ¾ÆÁú °ÍÀÌ´Ù. ±×·¯¹Ç·Î µÎ »óÁ¡ ¸ðµÎ °¡°ÝÀ» ³»¸®°Ô µÇ¾î ¸ðµÎ°¡ º¸´Ù ÀÛÀº ÀÌÀ±À» ¾ò°Ô µÇ°í, °á±¹¿¡´Â µÎ »óÁ¡ ¸ðµÎ °¡°ÝÀ» ³»¸®Áö ¾ÊÀº °æ¿ìº¸´Ù ÀÌÀ±ÀÌ ´õ ÀÛ°Ô µÈ´Ù. µÎ ±¹°¡°£ÀÇ ±ººñ°æÀïµµ ºñ½ÁÇÑ °æ¿ìÀÌ´Ù. °¢ ±¹ÀÇ '¹«Àå' °ú 'ºñ¹«Àå' À̶ó´Â µÎ °³ÀÇ Àü·«¿¡ ´ëÇÏ¿© °°Àº ÀÌÀ¯·Î ¼³¸íÀÌ °¡´ÉÇÏ´Ù.... (±Ç¿ÀÇå.À±ÅÂȯ 2000)

Á˼öÀÇ µô·¹¸¶´Â ºñ¿µÇÕ °ÔÀÓ (non-zero-sum game) ÀÇ ÀÏÁ¾ÀÌ´Ù. °ÔÀÓ ÀÌ·Ð (Game Theory) ¹®Á¦¿¡¼­, ´Ù¸¥ °æ¿ìµéó·³, °¢ÀÚ Ç÷¹À̾î´Â ´Ù¸¥ Ç÷¹À̾î´Â ¾îÂîµÇµç°£¿¡ ±× ÀÚ½ÅÀÇ À̵æÀ» ÃÖ´ë·Î ÇÏ·Á ÇÑ´Ù°í °¡Á¤ÇÑ´Ù. ÀÌ·¯ÇÑ Nash equilibrium Àº Á˼öÀÇ µô·¹¸¶¿¡¼­ »óÈ£ ÀûÀýÇÑ ÇØ°áÃ¥¿¡ À̸£Áö ¸øÇÑ´Ù ; ÆòÇü»óÅ¿¡¼­, °¢ Á˼öµéÀº ¼­·Î Çù·Â (cooperate) ÇÏ¸é º¸¼ö (payoff) °¡ ´õ ³ô¾ÆÁú ¼ö ÀÖÁö¸¸ º¯Àý (defect)À» ¼±ÅÃÇÑ´Ù. °¢ Á˼ö¿¡°Ô´Â ºÒÇàÇÑ ÀÏÀÌÁö¸¸, ¼­·Î Çù·ÂÀ» ¾à¼ÓÇÑ ÀÌÈÄ¿¡µµ ¼­·Î ¼ÓÀ̱â À§ÇÑ °¢ÀÚÀÇ µ¿±â (incentive)¸¦ °¡Áö°í ÀÖ´Ù. ÀÌ°ÍÀÌ ÀÌ µô·¹¸¶ÀÇ ÇÙ½ÉÀÌ´Ù.

Á˼öÀÇ µô·¹¸¶¸¦ ¹Ýº¹Çϸé ÆòÇüÀÇ °á°ú·Î¼­ »óÈ£ Çù·ÂÀÌ ¹ß»ýÇÒ ¼ö ÀÖ´Ù. °ÔÀÓÀº °è¼Ó ¹Ýº¹µÈ´Ù. °ÔÀÓÀÌ ¹Ýº¹µÊ¿¡ µû¶ó, °¢ Ç÷¹À̾î´Â ÀÌÀü¿¡ ºñÇùÁ¶ÀûÀ̾ú´ø ´Ù¸¥ Ç÷¹À̾°Ô ¹úÄ¢À» ºÎ¿©ÇÒ ±âȸ°¡ ÁÖ¾îÁø´Ù. ±×·³À¸·Î½á, ¼­·Î ¼ÓÀÌ°Ô ¸¸µé¾ú´ø µ¿±â´Â ¹úÄ¢À» ºÎ¿©ÇÏ°Ú´Ù°í À§ÇùÇÔÀ¸·Î½á ±Øº¹µÇ¾î, ´õ ³ªÀº ¼­·Î Çù·ÂÇÏ´Â °á°ú¸¦ ³ºÀ» ¼ö ÀÖ´Ù. ..... (Wikipedia : Prisoner's dilemma)

term :

Á˼öÀÇ µô·¹¸¶ (Prisoner's Dilemma)    John Nash    °ÔÀÓ ÀÌ·Ð (Game Theory)    ³»½ÃÆòÇü (Nash Equilibrium)    °æÁ¦ÇÐ (Economics)     Tragedy of the commons,  Tragedy of the anticommons,  ÇÕ¸®¼º (Rationality)   Superrationality,  Rendezvous problem,  Evolutionarily stable strategy,  Neuroeconomics,  ¼¼Æ÷ ÀÚµ¿ÀÚ (Cellular Automata)

°ü·Ã Àι° : John Nash     Nick Jennings   Graham Kendall   Robert Axelrod

site :

Wikipedia : Prisoner's dilemma)

Prisoner's dilemma game : Stanford

game theory : ¿ë¾î Á¤ÀÇ°¡ ÀߵǾî ÀÖÀ¸¸ç Á˼öÀÇ µô·¹¸¶¸¦ °£°áÇÏ°í Á¤È®ÇÏ°Ô ´Ù·ç¾î °ÔÀÓÀÌ·ÐÀ» Àß ¼Ò°³ÇÑ ¹®¼­

Repeated Prisoner's Dilemma Applet : Applet (collude : ¼­·Î °ø¸ðÇÏ´Ù, cheat : ¼­·Î ¼ÓÀÌ´Ù) ¡Ú¡Ú¡Ú : ³»°¡ collude or cheat¸¦ ¼±ÅÃÇÏ¸é »ó´ë°¡ ¹«¾ùÀ» ¼±ÅÃÇÏ´À³Ä¿¡ µû¶ó ³ª¿Í »ó´ë°¡ (³»°¡ ¿ÞÂÊ °ª) ¾ó¸¶ ¹ú¾ú´ÂÁö (earn) °¡ Ç¥½ÃµÈ´Ù.

New Tack Wins Prisoner's Dilemma

Prisoner's dilimma.com

paper :

Á˼öÀÇ µô·¹¸¶ : ±Ç¿ÀÇå. À±ÅÂȯ

°ÔÀÓÀ̷п¡¼­ º» ÇÑ-¹Ì Åë»ó°ü°è (The U.S.-South Korea Trade Relations in Terms of Game Theory) : ÀÌ»óȯ, Çѱ¹¼¼°èÁö¿ªÇÐȸ, 2003