Mini-max

 

Mini-max ´Â ¿¹»óµÇ´Â ÃÖ´ëÀÇ ¼Õ½Ç (maximum loss)¸¦ ÃÖ¼ÒÈ­½ÃÅ°±â (minimize) À§ÇØ »ç¿ëÇÏ´Â ÀÇ»ç°áÁ¤ÀÌ·Ð (Decision Theory) ÀÇ ÇÑ ¹æ¹ýÀÌ´Ù. ¹ÙµÏ (baduk) °ú °°Àº µÎ¸íÀÇ °ÔÀÓ Âü¿©ÀÚ°¡ ¼­·Î ¹ø°¥¾Æ °¡¸é¼­ µ¹À» ¿òÁ÷À̵簡 (alternate moves) µ¿½Ã¿¡ ¿òÁ÷ÀÌ´Â °æ¿ì¸¦ (simultaneoue moves) ¸ðµÎ ´Ù·ç´Â zero-sum °ÔÀÓÀÌ·Ð (Game Theory) ¿¡¼­ Ãâ¹ßÇÑ °ÍÀÌ´Ù. ÀÌ°ÍÀÌ ´õ¿í º¹ÀâÇÑ °ÔÀÓ (Game) À¸·Î È®ÀåµÇ¾ú°í, ¾î¶² ºÒÈ®½Ç¼º (Uncertainty) ÀÌ Á¸ÀçÇÏ´Â »óȲ¿¡¼­ÀÇ ÀϹÝÀûÀÎ ÀÇ»ç°áÁ¤À» Çϴµ¥ ±îÁö È®ÀåµÇ¾ú´Ù. ..... (Wikipedia : Minimax)

´ëºÎºÐÀÇ °ÔÀÓ¿¡¼­ ¿ÏÀüÇÑ Å½»ö (Search) (½ÂÆп¡ ´ëÇÑ) Àº ½ÇÁúÀûÀ¸·Î ºÒ°¡´ÉÇÏ´Ù. ü½º (chess) ÀÇ °æ¿ì ¿ÏÀüÇÑ °ÔÀÓ ±×·¡ÇÁ¿¡´Â 1040 °³ÀÇ ³ëµå°¡ ÀÖ´Â °ÍÀ¸·Î ÃßÁ¤µÈ´Ù. ÀÚ½Ä ³ëµåµéÀ» 1/3 ³ª³ë Ãʸ¶´Ù Çϳª¾¿ »ý¼ºÇÒ ¼ö ÀÖ´Ù°í °¡Á¤Çصµ ü½º¿¡ ´ëÇÑ ¿ÏÀüÇÑ Å½»ö ±×·¡ÇÁ¸¦ ¸¸µé¾î³»´Â µ¥´Â ¾à 1022 ¼¼±â°¡ °É¸°´Ù (Âü°í·Î, ¿ìÁÖÀÇ ³ªÀÌ´Â ¾à 108 ¼¼±â·Î ÃßÁ¤µÈ´Ù). ´õ¿íÀÌ, ÈÞ¸®½ºÆ½ Ž»ö (Heuristic Search) ±â¹ýµµ ½ÇÁúÀûÀÎ ºÐ±â °è¼ö¸¦ µµ¿òÀÌ µÉ ¸¸Å­ ÃæºÐÈ÷ ÁÙÀÌÁö´Â ¸øÇÑ´Ù. µû¶ó¼­ º¹ÀâÇÑ °ÔÀÓ¿¡ À־´Â °ÔÀÓÀÇ ³¡±îÁö Ž»öÇÑ´Ù´Â °ÍÀº (°ÔÀÓÀÇ ¸¶Áö¸· ºÎºÐ¿¡¼­´Â °¡´ÉÇÒ ¼öµµ ÀÖÁö¸¸) ºÒ°¡´ÉÇÏ´Ù´Â °ÍÀ» ¹Þ¾Æµé¿©¾ß¸¸ ÇÑ´Ù.

Á¾·á Á¶°ÇÀÌ ¹Ù²î¾î¾ß ÇÑ´Ù´Â °ÍÀ» Á¦¿ÜÇÏ°í´Â ³Êºñ¿ì¼± Ž»ö (Breadth-first Search) À̳ª ±íÀÌ¿ì¼± Ž»ö (Depth-first Search)¶Ç´Â ÈÞ¸®½ºÆ½ (Heuristic) ¹æ¹ý µîÀ» »ç¿ëÇÒ ¼ö ÀÖ´Ù. ¸î °¡Áö ÀÎÀ§ÀûÀÎ Á¾·á Á¶°ÇÀÌ ½Ã°£ Á¦ÇÑ, ¸Þ¸ð¸® Á¦ÇÑ, ¶Ç´Â Ž»öÆ®¸®¿¡¼­ ³ëµåÀÇ ±íÀÌ¿¡ ´ëÇÑ Á¦ÇÑ µîÀ» ±â¹ÝÀ¸·Î Á¤ÇØÁú ¼ö ÀÖ´Ù. ¶ÇÇÑ ¿¹¸¦ µé¾î ü½º °°Àº °ÔÀÓ¿¡¼­´Â ¸¸ÀÏ °æ°è¿¡ ÀÖ´Â ³ëµå°¡ Áï°¢ÀûÀ¸·Î À¯¸®ÇÑ ±³È¯À» ÇÒ ¼ö ÀÖ´Â ¶óÀ̺ê (live) À§Ä¡¸¦ Ç¥ÇöÇÏ°í ÀÖ´Ù¸é Ž»öÀ» Áß´ÜÇÏÁö ¾Ê´Â °ÍÀÌ ÀϹÝÀûÀÌ´Ù.

Ž»öÀÌ ³¡³ª¸é Ž»öÆ®¸®·ÎºÎÅÍ ÃÖ»óÀ̶ó°í ÃßÁ¤µÇ´Â ÇൿÀ» ã¾Æ³»¾ß ÇÑ´Ù. ÀÌ·¯ÇÑ ÃßÁ¤°ªÀº Ž»öÆ®¸®ÀÇ ´Ü¸» (leaf) ³ëµå¿¡ Á¤Àû Æò°¡ ÇÔ¼ö (static evaluation function) ¸¦ Àû¿ëÇÏ¿© ¾òÀ» ¼ö ÀÖ´Ù. Æò°¡ ÇÔ¼ö´Â ´Ü¸» ³ëµåÀÇ °¡Ä¡¸¦ °è»êÇÑ´Ù. ÀÌ·¯ÇÑ °è»êÀº ³ëµåÀÇ °¡Ä¡¿¡ ¿µÇâÀ» ¹ÌÄ£´Ù°í »ý°¢µÇ´Â ´Ù¾çÇÑ Æ¯Â¡À» ±â¹ÝÀ¸·Î ÀÌ·ç¾îÁø´Ù. ¿¹¸¦ µé¾î ü½º¿¡¼­ À¯¿ëÇÑ Æ¯Â¡µéÀº »ó´ëÀûÀÎ ¸»ÀÇ ÀÌÁ¡, Áß½ÉÀÇ Á¦¾î±Ç, Å·¿¡ ÀÇÇÑ Áß½ÉÀÇ Á¦¾î ¿©ºÎ µîÀ» µé ¼ö ÀÖ´Ù. °ÔÀÓÆ®¸®¸¦ ºÐ¼®ÇÒ ¶§ MAX ¿¡ À¯¸®ÇÑ »óÅ¿¡¼­´Â Æò°¡ ÇÔ¼ö°ªÀÌ ¾ç¼ö, MIN ¿¡ À¯¸®ÇÑ »óÅ¿¡¼­´Â Æò°¡ ÇÔ¼ö°ªÀÌ À½¼ö, ±×¸®°í MAX ³ª MIN ¾î´À Æí¿¡ Ưº°È÷ À¯¸®ÇÏÁö ¾ÊÀº »óÅ¿¡¼­´Â 0 ¿¡ °¡±î¿î °ªÀ» °®µµ·Ï ÇÏ´Â °ÍÀÌ º¸ÅëÀÌ´Ù. ..... ÁÁÀº ù ¹ø° ÇൿÀº ÃÖ´ëÃÖ¼Ò ÀýÂ÷ (minimax procedure) ¶ó°í ÇÏ´Â ¹æ¹ý¿¡ ÀÇÇØ ¼±Á¤µÉ ¼ö ÀÖ´Ù.... (Nils J.Nilsson 1998)

¾ËÆĺ£Å¸ °¡ÁöÄ¡±â (Alpha-Beta Pruning) Àº µÎ¸íÀÌ Âü¿©ÇÏ´Â °ÔÀÓÀ» À§ÇÑ ÃÖ¼ÒÃÖ´ë (Mini-max) ¾Ë°í¸®Áò¿¡ ÀÇÇØ Æò°¡µÇ´Â ³ëµåµéÀÇ ¼ö¸¦ °¨¼Ò½ÃÅ°±â À§ÇÑ ±â¼úÀÌ´Ù. Áï °ÔÀÓ¿¡¼­ »ó´ë¹æÀº Àý´ë µµ´ÞÇÏÁö ¸øÇϵµ·Ï ³ª¿¡°Ô¸¸ À¯¸®ÇÏ°Ô Å½»öÆ®¸®ÀÇ ÀϺκÐÀ» À߶󳻴 °ÍÀÌ´Ù..... Alpha-beta pruningÀ» °¡Áø minimax ´Â °¡ÁöÄ¡±â¸¦ ÇÏÁö ¾Ê´Â minimax ¿Í °°Àº °á°ú¸¦ º¸ÀÌÁö¸¸ ÈξÀ ´õ È¿À²ÀûÀÌ´Ù.

term :

°ÔÀÓ (Game)   Å½»ö (Search)    ºÒÈ®½Ç¼º (Uncertainty)   ÈÞ¸®½ºÆ½ (Heuristic)   ¾ËÆĺ£Å¸ °¡ÁöÄ¡±â (Alpha-Beta Pruning)   ÃÖ¼ÒÃÖ´ë (Mini-max)

site :

Wikipedia : Minimax

paper :

ÃÖ´ëÃÖ¼Ò ¹æ¹ý (The Minimax Procedure) : Nils J.Nilsson

ÃÖ¼ÒÃÖ´ëÁ¤¸® (Min-max theorem) : ±Ç¿ÀÇå. À±ÅÂȯ

ÃÖ¼Ò ÃÖ´ë ÃßÁ¤·®°ú º£ÀÌÁî ÃßÁ¤·®À¸·Î¼­ÀÇ Kalman ÇÊÅÍ¿¡ °üÇÏ¿© (On the Kalman Filter as the Bayes Estimator and the minimax Estimator) : ±èÁö°ï, »ó¸í´ë ÀÚ¿¬°úÇבּ¸¼Ò, 1998

Game Tree Searching by Min/Max Approximation : Ronald L. Rivest, Artificial Intelligence 34,1 (Dec. 1987), 77-96. 1987