º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇÑ ÇнÀ°ú Çൿ

(Learning and Acting with Bayes Nets)

 

ÀΰøÁö´É-Áö´ÉÇü ¿¡ÀÌÀüÆ®¸¦ Áß½ÉÀ¸·Î : Nils J.Nilsson Àú¼­, ÃÖÁß¹Î. ±èÁØÅÂ. ½É±¤¼·. À庴Ź °ø¿ª, »çÀÌÅع̵ð¾î, 2000  (¿ø¼­ : Artificial Intelligence : A New Synthesis 1998), Page 371~388

 

1. º£ÀÌÁö¾È ³×Æ®¿öÅ©ÀÇ ÇнÀ

  1.1 ¾Ë·ÁÁø ³×Æ®¿öÅ© ±¸Á¶

        °á¿©µÈ µ¥ÀÌÅÍ°¡ ¾ø´Â °æ¿ì

        °á¿©µÈ µ¥ÀÌÅÍ°¡ ÀÖ´Â °æ¿ì

  1.2 ³×Æ®¿öÅ© ±¸Á¶ÀÇ ÇнÀ

        Æò°¡ ôµµ

        ³×Æ®¿öÅ© °ø°£ÀÇ Å½»ö

2. È®·ü Ã߷аú Çൿ

  2.1 ÀÏ¹Ý ¼³Á¤

  2.2 È®ÀåµÈ ¿¹Á¦

  2.3 ¿¹Á¦ÀÇ ÀϹÝÈ­

3. Âü°í¹®Çå ¹× Åä·Ð

 

 

1. º£ÀÌÁö¾È ³×Æ®¿öÅ©ÀÇ ÇнÀ

º£ÀÌÁö¾È ³×Æ®¿öÅ© (Bayes network) ¸¦ ÇнÀÇÏ´Â ¹®Á¦´Â ÁÖ¾îÁø Æò°¡ ôµµ¿¡ µû¶ó µ¥ÀÌÅÍÀÇ ÈÆ·Ã ÁýÇÕ (training set) ¥Î ¿¡ °¡Àå Àß ºÎÇյǴ ³×Æ®¿öÅ©¸¦ ±¸ÇÏ´Â °ÍÀ̸ç, ¿©±â¼­ ¥Î ´Â ¸ðµç (¶Ç´Â Àû¾îµµ ¸î¸î) º¯¼ö¿¡ ´ëÇÑ °ªÀÇ »ç·Ê ÁýÇÕÀÌ´Ù. ³×Æ®¿öÅ©¸¦ ±¸ÇÑ´Ù´Â °ÍÀº DAG (directed acyclic graph) ±¸Á¶¿Í DAG ÀÇ °¢ ³ëµå¿¡ ¿¬°üµÈ Á¶°ÇºÎ È®·üÇ¥ (conditional probability table, CPT) ¸¦ ÇÔ²² ±¸ÇÏ´Â °ÍÀ» ÀǹÌÇÑ´Ù. 

1.1 ¾Ë·ÁÁø ³×Æ®¿öÅ© ±¸Á¶

¸¸ÀÏ ³×Æ®¿öÅ©ÀÇ ±¸Á¶¸¦ ¾È´Ù¸é CPT ¸¸À» ±¸ÇÏ¸é µÇ´Âµ¥ ÀÌ °æ¿ì¸¦ ¸ÕÀú ±â¼úÇغ¸ÀÚ. Àü¹®°¡µéÁ¶Â÷µµ ¹®Á¦ ¿µ¿ª¿¡ ¸Â´Â ±¸Á¶¸¸ ±¸ÇÏ°í CPT ´Â ¾òÁö ¸øÇÒ ¶§°¡ Á¾Á¾ ÀÖ´Ù. ³×Æ®¿öÅ© ±¸Á¶¸¦ ÇнÀÇØ¾ß ÇÏ´Â °æ¿ì¿¡µµ CPT ÀÇ ÇнÀÀº ÇÊ¿äÇÏ´Ù. CPT ÀÇ ÇнÀÀ» À§ÇÑ ¼³Á¤¿¡´Â °£´ÜÇÑ °Í°ú Á» º¹ÀâÇÑ °ÍÀÌ ÀÖ´Ù. °£´ÜÇÑ °æ¿ì´Â °á¿©µÈ µ¥ÀÌÅÍ (missing data) °¡ ¾ø´Â °æ¿ìÀÌ´Ù. Áï, ÈÆ·Ã ÁýÇÕ ¥Î ÀÇ °¢ ¿ä¼Ò´Â ³×Æ®¿öÅ©¿¡ Ç¥ÇöµÈ ¸ðµç º¯¼ö¿¡ ´ëÇØ °ªÀ» °¡Áø´Ù. ÇÏÁö¸¸ º¸´Ù Çö½ÇÀûÀÎ ¼³Á¤¿¡¼­´Â ¸î¸î ÈÆ·Ã ·¹Äڵ忡 ´ëÀÀ°ªÀÌ ¾ø´Â º¯¼ö°¡ Á¸ÀçÇÒ ¼ö ÀÖÀ¸¸ç ÀÌ·¯ÇÑ °á¿©µÈ µ¥ÀÌÅÍ°¡ CPT ÀÇ ÇнÀÀ» ¾î·Æ°Ô ¸¸µç´Ù.

G

M

B

L

»ç·Ê °³¼ö

Âü

Âü

Âü

Âü

54

Âü

Âü

Âü

°ÅÁþ

1

Âü

°ÅÁþ

Âü

Âü

7

Âü

°ÅÁþ

Âü

°ÅÁþ

27

°ÅÁþ

Âü

Âü

Âü

3

°ÅÁþ

°ÅÁþ

Âü

°ÅÁþ

2

°ÅÁþ

°ÅÁþ

°ÅÁþ

Âü

4

°ÅÁþ

°ÅÁþ

°ÅÁþ

°ÅÁþ

2

 

 

 

 

100

±×¸² 1  ¿¹Á¦ ³×Æ®¿öÅ©¿Í ¿¹Á¦°ª

G

M

B

L

»ç·Ê °³¼ö

Âü

Âü

Âü

Âü

54

Âü

Âü

Âü

°ÅÁþ

1

*

*

Âü

Âü

7

Âü

°ÅÁþ

Âü

°ÅÁþ

27

°ÅÁþ

Âü

*

Âü

3

°ÅÁþ

°ÅÁþ

Âü

°ÅÁþ

2

°ÅÁþ

°ÅÁþ

°ÅÁþ

Âü

4

°ÅÁþ

°ÅÁþ

°ÅÁþ

°ÅÁþ

2

1.2 ³×Æ®¿öÅ© ±¸Á¶ÀÇ ÇнÀ

³×Æ®¿öÅ© ±¸Á¶°¡ ¾Ë·ÁÁ® ÀÖÁö ¾ÊÀ¸¸é ÈÆ·Ã µ¥ÀÌÅÍ¿¡ °¡Àå ÀûÇÕÇÑ ±¸Á¶¿Í ¿¬°üµÈ CPT ¸¦ ã¾Æ¾ß ÇÑ´Ù. À̸¦ À§Çؼ­´Â Èĺ¸ ³×Æ®¿öÅ©¸¦ Æò°¡ÇÒ Ã´µµ°¡ ÇÊ¿äÇÏ°í, °¡´ÉÇÑ ±¸Á¶¸¦ Ž»öÇÏ´Â ÇÁ·Î½ÃÀú¸¦ ¸í½ÃÇØ¾ß ÇÑ´Ù. ÀÌ µÎ °¡Áö¸¦ ÀÌ Àý¿¡¼­ ´Ù·ç°íÀÚ ÇÑ´Ù.

 

±×¸² 2  ³×Æ®¿öÅ© ÇнÀ¿¡ ´ëÇÑ ½ÇÇè

 

±×¸² 3  µÎ °³ÀÇ ³×Æ®¿öÅ© - Çϳª´Â Àº´Ðº¯¼ö Æ÷ÇÔ

2. È®·ü Ã߷аú Çൿ

2.1 ÀÏ¹Ý ¼³Á¤

È®·ü Ãß·ÐÀ» ÀÌ¿ëÇÏ´Â ¸¹Àº ÀÀ¿ëÀÌ ÀÖ´Ù. ±× Áß¿¡¼­ µÎµå·¯Áø °ÍÀº ƯÁ¤ µ¥ÀÌÅÍ¿¡ Àû¿ëµÇ´Â ÀÏ¹Ý Áö½ÄÀ» ¹ÙÅÁÀ¸·Î °¡Àå ÀûÀýÇÑ ÃßÃøÀ» ÇÏ´Â Àú¹®°¡ ½Ã½ºÅÛ¿¡¼­ ã¾Æº¼ ¼ö ÀÖ´Ù. ÁÖ¾îÁø Áõ»ó¿¡ ´ëÇØ Áúº´ÀÇ »óŸ¦ Áø´ÜÇÏ´Â °ÍÀÌ ÇÑ ¿¹°¡ µÈ´Ù. ¿©±â¼­´Â ¿¡ÀÌÀüÆ®°¡ ÁÖ¾îÁø °¨Áö Á¤º¸¿Í ȯ°æ »óÅÂÀÇ Æò°¡ ôµµ¸¦ ¹ÙÅÁÀ¸·Î °¡Àå ÀûÀýÇÑ ´ÙÀ½ ÇൿÀ» °áÁ¤ÇØ¾ß ÇÒ ¶§, º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇÑ È®·ü Ãß·ÐÀ» ¾î¶»°Ô Àû¿ëÇÏ´ÂÁö¸¦ ±â¼úÇÏ°íÀÚ ÇÑ´Ù (¿©±â¼­´Â ´Ù·ç´Â ¹æ¹ýÀº [Russell & Norvig 1995 ÀÇ 17Àå] ¿¡ ±â¹ÝÀ» µÎ°í ÀÖÀ¸¸ç, [Dean & Wellman 1991 ÀÇ 7Àå] ÀÇ ¹æ¹ýµµ ±â¼úÇÑ´Ù).

¿©±â¼­ ´Ù·ç°íÀÚ ÇÏ´Â ¹®Á¦´Â °èȹ, Çൿ ±×¸®°í ÇнÀ¿¡¼­ ÀÌ¹Ì µµÀüÇß´ø ¹®Á¦¸¦ ÀϹÝÈ­ÇÑ °ÍÀÌ´Ù. ±×¶§ °¨Áö/°èȹ/Çൿ ÁÖ±â (sense/plan/act cycle) ¸¦ ÀÌ¿ëÇÑ ¿¡ÀÌÀüÆ®¿¡ ´ëÇØ ±â¼úÇß´ø °ÍÀ» ±â¾ïÇÒ °ÍÀÌ´Ù. °èȹ ´Ü°è¿¡¼­´Â ¸ñÀûÀ» ÇâÇØ ¸î ´Ü°è ³»´Ùº¸´Â ¹æ¹ýÀ» ÀÌ¿ëÇÏ¿© ÇöÀç ȯ°æ »óȲ¿¡¼­ ÃëÇØ¾ß ÇÒ °¡Àå ÀûÀýÇÑ ´ÙÀ½ ÇൿÀ» °è»êÇÏ¿´´Ù. Çൿ ´Ü°è¿¡¼­´Â °èȹÀÚ°¡ ÃßõÇÑ ¸Ç óÀ½ ÇൿÀ» ¼öÇàÇÏ¿´°í, °¨Áö ´Ü°è´Â ´ÙÀ½ Áֱ⸦ À§ÇØ °á°ú·Î ³ªÅ¸³ª´Â ȯ°æ »óȲÀ» ÀνÄÇÏ¿´´Ù. °èȹ, Çൿ ±×¸®°í ÇнÀ¿¡¼­´Â ¶ÇÇÑ ¸ñÇ¥ (goal) ÀÇ °³³äÀ» ƯÁ¤ÇÑ È¯°æ »óÅ¿¡¼­ ÁÖ¾îÁö´Â (¶Ç´Â »©¾Ñ´Â) º¸»ó ¸ñ·Ï (schedule of rewards) À̶õ °ÍÀ¸·Î ÀϹÝÈ­½ÃÄ×´Ù. ÀÌ º¸»óÀº ´Ù½Ã °¢ »óÅ¿¡ ´ëÇؼ­ ¾î¶² "°ª" À» À̲ø¾î³»´Âµ¥, ÀÌ °ªÀº ¿¡ÀÌÀüÆ®°¡ º¸»óÀ» ÃÖ´ëÈ­Çϱâ À§ÇØ ÇൿÇÏ¿© ¾òÀ» ¼ö ÀÖ´Â ÃÑ ÇÒÀÎµÈ ÃßÈÄ º¸»ó (future reward) À¸·Î ³ªÅ¸³½´Ù. ¿©±â¼­´Â È¿¿ë¼º (utility) ÀÌ °¢ ȯ°æ »óÅ¿¡¼­ ±âÀÎÇÑ´Ù°í º¸°í ÀÌ·¯ÇÑ ÀϹÝÈ­µÈ ¸ñÇ¥ÀÇ °³³äÀ» °è¼Ó À¯ÁöÇÏ°íÀÚ ÇÑ´Ù.

ÀÌÀü¿¡ ±â¼úÇÑ °¨Áö/°èȹ/Çൿ ¿¡ÀÌÀüÆ®ÀÇ ±¸Á¶¿¡¼­´Â ȯ°æ¿¡ ´ëÇÑ °¡Á¤À̳ª °¨Áö¿Í ÇൿÀÇ ½Å·Ú¼º¿¡ ´ëÇÑ °¡Á¤ÀÌ ´Ù¼Ò ÀÏ°üÀûÀÌÁö ¸øÇÏ¿´´Ù. Áï, ¿¡ÀÌÀüÆ®°¡ °¨Áö ÀÛ¾÷À» ÅëÇؼ­ ÇöÀç »óŸ¦ Á¤È®È÷ °áÁ¤ÇÒ ¼ö ÀÖ°í ¸ðµç ÇൿÀÇ °á°ú¸¦ Á¤È®È÷ ¿¹ÃøÇÒ ¼ö ÀÖ´Ù°í °¡Á¤ÇÏ¿´´Ù. ÇÏÁö¸¸ ÀÌ·¯ÇÑ °¡Á¤ÀÌ ¸ÂÁö ¾Ê´Â °æ¿ì (ÀϹÝÀûÀ¸·Î ¸ÂÁö ¾ÊÀ½), ¿¡ÀÌÀüÆ®´Â ´ÜÀÏ ÇൿÀ» ÃëÇÏ°í ¹Ù·Î ¼¾¼­¸¦ ÀÌ¿ëÇÏ¿© ȯ°æ »óÅ°¡ ½ÇÁ¦·Î ¾î¶»°Ô ¹Ù²î¾ú´ÂÁö¸¦ ÆľÇÇÏ¿´´Ù. ÀÌ Á¢±Ù ¹æ¹ýÀ» ÇÕ¸®ÀûÀ¸·Î ´Ù·ç±â À§ÇØ, ¼öÇàÇÑ ÇൿÀÌ Ç×»ó ¿¹ÃøµÈ °á°ú¸¦ ³»Áö ¾Ê°Å³ª ¼¾¼­°¡ °¡²û Çൿ ¿À·ù¸¦ ÀÏÀ¸Å°´õ¶óµµ ¼¾¼­°¡ ¿¡ÀÌÀüÆ®¿¡°Ô »óÅ°ø°£¿¡¼­ÀÇ ÁøÇà »óȲÀ» ¾Ë·ÁÁÖ°í ¹Ýº¹ÀûÀ¸·Î °èȹ¼ö¸³À» ÇÏ¿© ¿¡ÀÌÀüÆ®°¡ ¿ä±¸ÇÏ´Â ¸ñÀû (¶Ç´Â º¸»ó) À» ÇâÇØ °¥ ¼ö ÀÖµµ·Ï ¹æÇâÀ» ÀçÁ¶Á¤Çϵµ·Ï ÇÏ¿´´Ù.

ÀÌÁ¦ ºÒÈ®½Ç¼ºÀ» ÀûÀýÈ÷ ´Ù·ê ¼ö ÀÖ´Â µµ±¸°¡ ¸¶·ÃµÇ¾ú±â ¶§¹®¿¡ ¸í½ÃÀûÀ¸·Î Á» ´õ Çö½ÇÀûÀÎ °¡Á¤À» äÅÃÇÒ ¼ö ÀÖ´Ù. »õ·Î¿î ¿¡ÀÌÀüÆ®´Â ÀÚ½ÅÀÌ ¾î¶² »óÅ¿¡ ÀÖ´ÂÁö ¾Ë±âº¸´Ù´Â ÀÚ½ÅÀÌ ¿©·¯ ´Ù¾çÇÑ »óÅ¿¡ ´ëÇØ ³õÀÏ ¼ö ÀÖ´Â È®·ü¸¸À» ¾Ë°Ô µÈ´Ù. ±×¸®°í ȯ°æ »óÅ¿¡ ´ëÇÑ Á¤È®ÇÑ Áö½ÄÀ» ÁÖ´Â ¼¾¼­ ´ë½Å¿¡ ¿¡ÀÌÀüÆ®ÀÇ ¼¾¼­´Â ÀÌ·¯ÇÑ È®·üÀ» ´Ùµë¾îÁÖ´Â Á¤µµÀÇ ÀÏÀ» ÇÒ »ÓÀÌ´Ù. ÇൿÀÇ °á°ú´Â ¸·¿¬ÇÏ°Ô¸¸ ¾Ë ¼ö Àִµ¥, ÁÖ¾îÁø »óÅ¿¡¼­ ÃëÇÑ ÇൿÀÇ °á°ú´Â »õ·Î¿î »óÅÂÀÇ ÁýÇÕ¿¡ ÀÖ´Â ¾î¶² »óŵµ µÉ ¼ö ÀÖÀ¸¸ç °¢ »óŸ¶´Ù È®·üÀÌ ¿¬°üµÇ¾î ÀÖ´Ù. °èȹ ¼ö¸³°ú °¨Áö ÀÛ¾÷À» ÅëÇؼ­ ¿¡ÀÌÀüÆ®°¡ È¿¿ë¼ºÀÇ ±â´ë°ªÀ» ÃÖ´ëÈ­ÇÏ´Â ÇൿÀ» ¼±ÅÃÇÒ ¼ö ÀÖµµ·Ï ÇÏ°íÀÚ ÇÑ´Ù. ¿¡ÀÌÀüÆ®°¡ ÀÌ·¯ÇÑ ¹®Á¦¸¦ ¿ÏÀüÈ÷ ÀϹÝÈ­½ÃÄÑ ´Ù·ê ¼ö ÀÖµµ·Ï ÇÏ·Á¸é ¸Å¿ì ¸¹Àº °è»êÀÌ ÇÊ¿äÇϱ⠶§¹®¿¡ ±Ù»çÄ¡ °è»êÀ̳ª ´Ù¸¥ Á¦ÇÑÀûÀÎ °¡Á¤À» ÇØ¾ß ÇÑ´Ù. ÀÌ·¯ÇÑ ³»¿ë¿¡ ´ëÇØ ´ÙÀ½ Àý¿¡¼­ ¿¹Á¦¸¦ µé¾î ³íÀÇÇÏ°íÀÚ ÇÑ´Ù.

2.2 È®ÀåµÈ ¿¹Á¦

¾Õ¿¡¼­ ³íÀǵǾú´ø °¡Á¤À» ¹ÙÅÁÀ¸·Î ÀÛ¾÷ÇÒ °æ¿ì °è»êÀÌ ¸Å¿ì ¾î·Á¿öÁö±â ¶§¹®¿¡, ÀÌ ¿¹Á¦¿¡¼­´Â ¾ÆÁÖ °£´ÜÇÑ ¿¡ÀÌÀüÆ®¿Í ȯ°æÀ» ÀÌ¿ëÇؼ­ ÁÖµÈ ¾ÆÀ̵ð¾î¸¦ Èñ¼®½ÃÅ°Áö ¾Ê°Ô ÇÏ·Á°í ÇÑ´Ù. °¡·É ±×¸² 4 ¿¡¼­¿Í °°ÀÌ 5 °³ÀÇ ¼¿·Î ±¸¼ºµÈ 1 Â÷¿ø °ÝÀÚ (grid) ¿¡ Á¸ÀçÇÏ´Â ·Îº¿À» °í·ÁÇÏÀÚ. ÀÌ °æ¿ì ȯ°æ »óÅ´ ·Îº¿ÀÇ À§Ä¡¸¸À» Æ÷ÇÔÇϸç, ÀÌ°ÍÀº {-2, -1, 0, 1, 2} ÀÇ 5 °³ÀÇ °¡´ÉÇÑ °ªÀ» °®´Â »óź¯¼ö E ·Î ³ªÅ¸³½´Ù. °¢ À§Ä¡´Â ·Îº¿¿¡ ´ëÇÑ È¿¿ë°ª (utility) U ¸¦ °¡Áø´Ù. °¡¿îµ¥ ¼¿Àº È¿¿ë°ªÀÌ 0 À̸ç, ÀÌ·¯ÇÑ È¿¿ë°ªµéÀ» ±×¸²¿¡ ³ªÅ¸³»¾ú´Ù. Ãʱ⿡´Â ·Îº¿ÀÌ t = 0 ÀÎ ½Ã°£¿¡ ÀÚ½ÅÀÌ 0 À¸·Î Ç¥½ÃµÈ ¼¿¿¡ ÀÖ´Ù´Â °ÍÀ» (Á¤È®È÷) ¾È´Ù°í °¡Á¤ÇÑ´Ù. Áï, E0 = 0 ÀÌ´Ù.

±×¸² 4  5 °³ÀÇ ¼¿¿¡ °¤Èù ·Îº¿

i ¹ø° ½ÃÁ¡¿¡¼­ ·Îº¿ÀÌ ÃëÇÏ´Â ÇൿÀº Ai ÀÇ ±âÈ£·Î ³ªÅ¸³½´Ù. ·Îº¿Àº ¿ÞÂÊÀ¸·Î ÇÑ ¼¿¸¸Å­ À̵¿ (Ai = L) Çϰųª ¿À¸¥ÂÊÀ¸·Î ÇÑ ¼¿¸¸Å­ À̵¿ (Ai = R) ÇÒ ¼ö ÀÖ´Ù. ¾î´À °æ¿ìÀÌ°Ç ÇÑ ¹ø À̵¿ÇÏ¿© ÀǵµµÈ °á°ú°¡ ³ª¿Ã È®·üÀº 0.5 ÀÌ°í, °¢ ÇൿÀÇ °á°ú·Î ¾Æ¹« º¯È­°¡ ¾øÀ» È®·üÀº 0.25 À̸ç, ÇÑ ÇൿÀÌ ·Îº¿À» ÀǵµµÈ ¹æÇâ°ú ¹Ý´ë ¹æÇâ¿¡ ÀÖ´Â ÀÎÁ¢¼¿·Î À̵¿ÇÏ°Ô ÇÒ È®·üÀº 0.25 ÀÌ´Ù. µû¶ó¼­, óÀ½ ¸î ¹øÀ» ¿òÁ÷ÀÌ°í ³ª¸é ·Îº¿Àº ÀÚ½ÅÀÇ ½ÇÁ¦ À§Ä¡¿¡ ´ëÇÑ È®·ü Áö½Ä¸¸À» °¡Áö°Ô µÈ´Ù.

·Îº¿Àº °¨Áö½ÅÈ£ Si ¸¦ ÅëÇØ i ¹ø° ½ÃÁ¡¿¡¼­ÀÇ ÀÚ½ÅÀÇ À§Ä¡¸¦ °¨ÁöÇÑ´Ù. ÇÏÁö¸¸ ¼¾¼­°¡ ´Ù¼Ò ½Å·Ú¼ºÀÌ ¾ø´Ù°í °¡Á¤ÇÑ´Ù. Áï, Ei °¡ ¾î¶² °ªÀ» °¡Áú ¶§, Si °¡ °°Àº °ªÀ» °¡Áú È®·üÀ» 0.9 ·Î ÇÏ°í, ´Ù¸¥ °ª 4 °¡Áö Áß ÇϳªÀÏ È®·üÀº 0.025 ÀÌ´Ù.

ÀÌ ·Îº¿¿¡¼­ÀÇ ¹®Á¦´Â ¿©·¯ ºÒ¸®ÇÑ Á¶°Ç¿¡ Á÷¸éÇßÀ» ¶§ ¸î ´Ü°è ¾ÕÀ» ³»´Ùº¸°í È¿¿ë¼ºÀÇ ±â´ë°ªÀÌ ÃÖ´ë°¡ µÇµµ·Ï À̵¿ÇÏ´Â °ÍÀÌ´Ù. ·Îº¿ÀÇ ´ÙÀ½ ÇൿÀ» ¼±ÅÃÇÒ ¶§ ÀÌ¿ëµÇ´Â °áÁ¤ ±â¹ýÀº ÇÑ ´Ü°è¸¸ ³»´Ù º» È¿¿ë°ª ±â´ëÄ¡ÀÇ ÃÖ´ëÈ­¸¦ ÅëÇØ ¾ÆÁÖ ½±°Ô ¼³¸íµÉ ¼ö ÀÖ´Ù. ·Îº¿ÀÌ t = 0, Áï A0 = R ÀÏ ¶§ ¿À¸¥ÂÊÀ¸·Î À̵¿ÇÏ·Á ÇÑ´Ù°í ÇÏÀÚ. ÀÌ ÇൿÀÇ °á°ú·Î ¾ò¾îÁö´Â ȯ°æ »óÅ´ Ei ÀÌ µÈ´Ù. ÀÌ ·Îº¿ÀÌ °¨Áö/°èȹ/ÇൿÀÇ Áֱ⸦ °è¼ÓÇϸé ÀÚ½ÅÀÇ À§Ä¡¸¦ ¿¹¸¦ µé¾î Si = 1 À̶ó°í °¨ÁöÇÏ°Ô µÈ´Ù. ´ÙÀ½Àº ¾îµð·Î À̵¿ÇØ¾ß Çϴ°¡? ÀÌ·¸°Ô À̵¿ÇÑ ÈÄ¿¡´Â °¨ÁöµÈ µ¥ÀÌÅ͸¦ ¹ÙÅÁÀ¸·Î ÇÑ À̵¿À̳ª ÇöÀç À§Ä¡¿¡ ´ëÇÑ Ãß·Ð, ±×¸®°í ÇൿÀÇ °á°ú¸¦ ¾î¶»°Ô Áö¼ÓÀûÀ¸·Î ¼±ÅÃÇÒ ¼ö Àִ°¡?

±×¸² 5  µ¿Àû°áÁ¤ ³×Æ®¿öÅ©

µ¿Àû °áÁ¤ ³×Æ®¿öÅ© (dynamic decision network) ¶ó ºÎ¸£´Â Ư¼öÇÑ ÇüÅÂÀÇ ¹ÏÀ½ ³×Æ®¿öÅ© (belief network) ¸¦ ÀÌ¿ëÇÏ´Â È®·ü Ãß·ÐÀº È¿¿ë¼ºÀ» ÃÖ´ëÈ­ÇÏ´Â ÇൿÀ» ¼±ÅÃÇϱâ À§ÇØ »ç¿ëµÉ ¼ö ÀÖ´Ù. ÀÌ ¹®Á¦¿¡ ÀûÇÕÇÑ ³×Æ®¿öÅ©¸¦ ±×¸² 5 ¿¡ ³ªÅ¸³»¾ú´Ù. ÀÌ ³×Æ®¿öÅ©´Â ÇൿÀÌ ÃëÇØÁö°í »õ·Ó°Ô °¨ÁöµÈ Á¤º¸°¡ ÀÖÀ» ¶§¸¶´Ù ·Îº¿ÀÌ ¹Ýº¹ÀûÀ¸·Î Ãß·ÐÀ» ÇÒ ¼ö ÀÖµµ·Ï ÇØÁØ´Ù. E0 = 0, A0 = R, Si = 1 ÀÇ °ªÀÌ ÁÖ¾îÁö¸é Åë»óÀûÀÎ È®·ü Ãß·ÐÀ» ÀÌ¿ëÇؼ­, A1 = R °ú A1 = L ·ÎºÎÅÍ ¾òÀ» ¼ö ÀÖ´Â È¿¿ë°ª ±â´ëÄ¡ÀÎ U2 ¸¦ °è»êÇÑ´Ù. ±×¸®°í ³ª¼­ ·Îº¿Àº ÀÌ Áß ´õ Å« °ªÀ» ÁÖ´Â ÇൿÀ» ¼±ÅÃÇÑ´Ù [¾Æ °æ¿ì ÇൿÀÇ ¼±ÅÃÀº ÇÑ ¹øÀÇ À̵¿¸¸ ³»´Ùº»´Ù. ´õ ¸¹ÀÌ ¿¹°ßÇÏ°Ô µÇ¸é ÀÏ·ÃÀÇ ´ë¾È Çൿ (alternative action sequence) ¿¡ ´ëÇÑ ¿ø°Å¸® È¿¿ë°ª (distant utility) À» ´õ ¸¹ÀÌ °è»êÇØ¾ß ÇÑ´Ù]. µ¿Àû°áÁ¤ ³×Æ®¿öÅ©¿¡¼­´Â ¼­·Î ´Ù¸¥ °¡Á¤À» °®´Â ³ëµå¸¦ ±¸º°Çϱâ À§ÇØ ´Ù¸¥ ¸ð¾çÀÇ ³ëµå¸¦ ÀÌ¿ëÇÑ´Ù. »óÀÚ¸ð¾çÀÇ ³ëµå (¡á) ´Â ¿©ÀüÈ÷ ¿¡ÀÌÀüÆ®¿¡ ÀÇÇØ °ªÀÌ Á¦¾îµÇ´Â º¯¼ö¸¦ °¡¸®Å²´Ù. ÀÌ·± ³ëµå¸¦ °áÁ¤ ³ëµå (decision node) ¶ó ÇÑ´Ù. µ¿Àû °áÁ¤ ³×Æ®¿öÅ©¿¡¼­ ¿¡ÀÌÀüÆ®°¡ ÀÌ ³ëµå¸¦ ¼±ÅÃÇÑ ÈÄ¿¡´Â ÀÌ ³ëµå´Â Åë»óÀûÀÎ ¹ÏÀ½ ³×Æ®¿öÅ© ³ëµå (°ªÀÌ ¾Ë·ÁÁø) °¡ µÈ´Ù. ´ÙÀ̾Ƹóµå ¸ð¾çÀÇ ³ëµå (¡ß) ´Â È¿¿ë°ªÀ» ³ªÅ¸³»´Â º¯¼ö¸¦ °¡¸®Å²´Ù. È¿¿ë¼º º¯¼öÀÇ ±â´ë°ªÀº ¿©·¯ °¡Áö ºÎ¸ð°ªµéÀÇ È®·ü¿¡ ´ëÇÑ ÇÔ¼öÀÌ´Ù.

³×Æ®¿öÅ© ±¸Á¶¸¦ º¸¸é ȯ°æÀÌ ¸¶¸£ÄÚÇÁ ȯ°æÀÎ °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. Áï, ½Ã°£ t + 1 ÀÏ ¶§ÀÇ È¯°æ »óÅ´ (°¨ÁöÇÏÁö ¾Ê°íµµ) ½Ã°£ t ÀÏ ¶§ÀÇ È¯°æ »óÅÂ¿Í Çൿ¿¡ ÀÇÇؼ­ (È®·üÀûÀ¸·Î) ¿ÏÀü °áÁ¤µÈ´Ù. ÀÌ·± Ãø¸é¿¡¼­ ´ëºÎºÐÀÇ ¿¡ÀÌÀüÆ® ȯ°æÀÌ ¸¶¸£ÄÚÇÁ ȯ°æÀ̶ó°í °¡Á¤ÇÒ ¼ö ÀÖ´Ù (Ãß°¡ º¯¼ö¸¦ µµÀÔÇÏ¿© ¸¶¸£ÄÚÇÁ ȯ°æÀ» ¸¸µé ¼öµµ ÀÖ´Ù). ¶ÇÇÑ ÀÌ ³×Æ®¿öÅ©ÀÇ ±¸Á¶´Â ½Ã°£ t ¿¡¼­ÀÇ È¯°æ¿¡ ´ëÇØ t ¿¡¼­ °¨ÁöµÈ °ÍÀº ±× Àü¿¡ °¨ÁöµÈ ¸ðµç °Í°ú Á¶°ÇºÎ µ¶¸³ÀûÀ̶ó´Â °¡Á¤À» ³»Æ÷ÇÑ´Ù.

t = 1 ÀÏ ¶§ °èȹµÈ (È¿¿ë°ª ±â´ëÄ¡ÀÎ U2 ¸¦ ÃÖ´ëÈ­ÇÏ´Â °úÁ¤À» °ÅÃÄ °èȹÀÌ ¼ö¸³µÈ) ÇൿÀ» ÃëÇÏ¿© ½ÃÁ¡À» Çϳª ¾ÕÀ¸·Î À̵¿½ÃÅ°°í ´ÙÀ½ »óÅÂÀÎ E2 ¿¡¼­ S2 ¸¦ °¨ÁöÇÑ ÈÄ¿¡´Â ¶Ç ´Ù¸¥ °¨Áö/°èȹ/ÇൿÀÇ Áֱ⸦ °¡Áö°í Àüü °úÁ¤ÀÌ ¹Ýº¹µÈ´Ù. ÇÊ¿äÇÑ °è»ê Áß ÀϺθ¦ Á÷Á¢ Çغ¸´Â °ÍÀÌ µµ¿òÀÌ µÉ °ÍÀÌ´Ù.

¸ÕÀú, A1 ¿¡ ´ëÇÑ ¼­·Î ´Ù¸¥ µÎ °¡Áö È®·üÀ» °¡Á¤ÇÏ¿©, ½Ã°£ t = 0 ¿¡¼­ ¾Ë·ÁÁø °Í¿¡ ´ëÇÑ µÎ °³ÀÇ È¿¿ë°ª ±â´ëÄ¡¸¦ °è»êÇØ¾ß ÇÑ´Ù.

ÀÌ ±â´ë°ªÀ» ±¸Çϱâ À§Çؼ­´Â A1 ÀÇ µÎ °ªÀÇ °¢°¢¿¡ ´ëÇؼ­ E2 ÀÇ ¿©·¯ °ª¿¡ ´ëÇÑ (E2 | E0 = 0, A0 = R, S1 = 1 , A1) À» °è»êÇØ¾ß ÇÑ´Ù. ÀÌ·¯ÇÑ ÇüÅÂÀÇ °è»êÀº ³ªÁß ´Ü°è¿¡¼­µµ ¹Ýº¹µÇÁö¸¸ ±¸Ã¼È­Çϱâ À§ÇØ Çö ´Ü°è¿¡ ´ëÇؼ­ ¼öÇàÇÏ°íÀÚ ÇÑ´Ù. ÀÌ ÇüÅ´ A1 ÀÇ °¢ °ª¿¡ ´ëÇØ µ¿ÀÏÇϱ⠶§¹®¿¡ A1 = R ÀÏ °æ¿ì¸¸ ±¸ÇÏ¸é µÈ´Ù. ¾ÕÀå¿¡¼­ ¼³¸íÇÑ ´ÙÁßÆ®¸® (polytree) ¾Ë°í¸®ÁòÀ» ÀÌ¿ëÇÏ¿© (E2 | E0 = 0, A0 = R, S1 = 1, A1 = R) À» °è»êÇØ º¸ÀÚ.

¸ÕÀú, "°ªÀÌ ÁÖ¾îÁöÁö ¾ÊÀº ºÎ¸ð¸¦ Æ÷ÇÔ½ÃÄÑ" ´ÙÀ½À» ¾ò´Â´Ù.

·Îº¿ÀÇ ÇൿÀ» ¼±ÅÃÇϱâ À§ÇØ »ç¿ëµÇ´Â °áÁ¤ ³×Æ®¿öÅ©¿¡¼­´Â ÀÌ ÇÕ»ê °ø½ÄÀÇ Ã¹ ¹ø° Ç×À» ¸¶¸£ÄÚÇÁ ÇÁ·Î¼¼½ºÀÇ Çൿ ¸ðµ¨ (action model) À̶ó ÇÑ´Ù. ÀÌ ¸ðµ¨Àº ¹Ù·Î ÀüÀÇ »óÅÂ¿Í ÇൿÀÌ ÁÖ¾îÁ³À» ¶§ °¡´ÉÇÑ ¿©·¯ °¡Áö ´ÙÀ½ »óȲ¿¡ ´ëÇÑ È®·üÀ» ³ªÅ¸³½´Ù. ´ÙÁßÆ®¸® ¾Ë°í¸®Áò¿¡ µû¸£¸é ÀÌ ÇÕ»ê °ø½ÄÀÇ µÎ ¹ø° Ç×Àº º£ÀÌÁö¾È ±ÔÄ¢À» ÀÌ¿ëÇÏ¿© ´ÙÀ½°ú °°ÀÌ ´Ù½Ã ¾µ ¼ö ÀÖ´Ù.

ÀÌ °ö¼À¿¡¼­ ù ¹ø° Ç×À» ¼¾¼­ ¸ðµ¨ (sensor model) À̶ó ÇÑ´Ù. ÀÌ ¸ðµ¨Àº ÀÓÀÇÀÇ È¯°æ »óȲ¿¡ ´ëÇؼ­ ¼¾¼­°¡ ¿©·¯ °ªÀ» °¡Áú È®·üÀ» ³ªÅ¸³½´Ù (¿ÏÀüÈ÷ ½Å·ÚÇÒ ¼ö ÀÖ°í ¸Å¿ì À¯ÀÍÇÑ ¼¾¼­¶ó¸é ¸ðµç È®·üÀ» ±¸ÇÒ ¶§ °¢ ȯ°æ »óÅ¿¡ ´ëÇؼ­ ÇϳªÀÇ ¼¾¼­°ª¿¡¸¸ ÁýÁßÇÒ °ÍÀÌ´Ù). µÎ ¹ø° Ç×Àº ¾Õ¿¡¼­¿Í °°ÀÌ Çൿ ¸ðµ¨ÀÌ µÈ´Ù.

ÀÌ °á°úµéÀ» ¸ðÀ¸¸é ´ÙÀ½°ú °°´Ù.

ÀÌ Ç¥Çö½ÄÀ» (E2 ÀÇ ¿©·¯ °ª¿¡ ´ëÇØ) °è»êÇϱâ À§ÇØ ÇൿÀÇ °á°ú¿Í ¼¾¼­ÀÇ ½Å·Ú¼º¿¡ ´ëÇØ ³»·È´ø È®·ü°¡Á¤À» ÀÌ¿ëÇÑ´Ù. À̸¦ ½Ã¿¬Çϱâ À§ÇØ   (E2 = 1 | E0 = 0, A0 = R, S1 = 1, A1 = R) ¸¸À» °è»êÇØ º¸ÀÚ. ÀÌ °è»êÀº ´ÙÀ½°ú °°Àº È®·üÀ» Æ÷ÇÔÇϸç ÀÌ È®·üÀº ±×¸² 5 ¿¡ ÀÖ´Â ³×Æ®¿öÅ©¿¡ ´ëÇÑ CPT ÀÇ Ç׸ñÀ¸·Î µé¾î°¡°Ô µÈ´Ù (¸ðµç E1 °ª¿¡ ´ëÇØ ÇÕ»êÀ» ÇØ¾ß ÇÑ´Ù).

ÇÕ»êÀ» ÇÏ¸é ´ÙÀ½°ú °°ÀÌ µÈ´Ù.

E2 ÀÇ ´Ù¸¥ °ª¿¡ ´ëÇÑ (E2 | E0 = 0, A0 = R, S1 = 1, A1 = R) ¸¦ ±¸Çϱâ À§Çؼ­µµ À¯»çÇÑ °è»êÀ» ¼öÇàÇÑ´Ù. ÀÌ ¸ðµç È®·üÀÇ ÇÕÀº 1 À̹ǷΠ¸¦ ±¸ÇÒ ¼ö ÀÖ´Ù. E2 ¿¡ ´ëÇÑ ÀÌ È®·üÀ» ÀÌ¿ëÇؼ­ A1 = R ÀÏ ¶§ÀÇ U2 ÀÇ ±â´ëÄ¡¸¦ °è»êÇÏ°Ô µÈ´Ù. ÀÌ °úÁ¤À» ¹Ýº¹ÇÏ¿© A1 = L ÀÏ ¶§ U2 ÀÇ ±â´ëÄ¡¸¦ °è»êÇÏ°í ±× Áß Å« °ªÀ» °¡Áö´Â ÇൿÀ» ¼±ÅÃÇÏ°Ô µÈ´Ù (ÀÌ ¹®Á¦ÀÇ ±¸Á¶·Î º¼ ¶§ A1 = R ÀÇ ÇൿÀÌ ¼±ÅÃµÉ °ÍÀÌ ´ç¿¬ÇÏÁö¸¸ ¹æ¹ýÀ» ¼³¸íÇϱâ À§ÇØ ÀÌ ¿¹Á¦¸¦ ÀÌ¿ëÇÏ¿´´Ù)

2.3 ¿¹Á¦ÀÇ ÀϹÝÈ­

(E2 | E0 = 0, A0 = R, S1 = 1, A1 = R) ¿¡ ´ëÇÑ °ø½ÄÀ» ºÐ¼®ÇØ º¸¸é ÀÌ °ø½ÄÀ» Â÷ÈÄÀÇ ½ÃÁ¡À¸·Î È®ÀåÇÒ ¼ö ÀÖ´Ù´Â °ÍÀ» ¾Ë ¼ö ÀÖ´Ù. ÀÌ °ø½ÄÀº ½Ã°£ t = 1 ¿¡¼­ S1 = 1 ÀÌ °¨ÁöµÇ°í ³ª¼­ A1 = R ÀÇ ÇൿÀÌ ÃëÇØÁö±â Àü¿¡ °è»êµÈ´Ù. µû¶ó¼­ À§ÀÇ °ø½Ä ´ë½Å¿¡ (E2 | <values before t = 1>, S1 = 1, A1 = R) °ú °°ÀÌ ¾µ ¼ö ÀÖ´Ù. ÀÌ¿Í ºñ½ÁÇÏ°Ô ÇÕ»ê °ø½Ä¿¡¼­ÀÇ (E1 | E0 = 0, A0 = R) ÀÇ Ç¥Çö½ÄÀº (E1 | <values before t = 1>) °ú °°ÀÌ ¾µ ¼ö ÀÖ´Ù. ÀÌ·¯ÇÑ º¯°æÀ» °í·ÁÇÏ¸é ´ÙÀ½°ú °°Àº ½ÄÀ» ¾ò´Â´Ù.

Çൿ¿¡ ´ëÇÑ °áÁ¤À» ³»¸®±â À§Çؼ­´Â ½Ã°£ÀÌ °æ°úÇÒ ¶§¸¶´Ù ´ÙÀ½°ú °°Àº ¹æ¹ýÀ¸·Î ÀÌ °ø½ÄÀ» ÀÌ¿ëÇÑ´Ù. ½Ã°£ t = i ¿¡¼­ ÃëÇÒ A1 ÀÇ ÇൿÀ» °è»êÇϱâ À§Çؼ­´Â ´ÙÀ½°ú °°ÀÌ ÇÑ´Ù.

1. ¹Ù·Î ÀüÀÎ (i - 1) ½ÃÁ¡À¸·ÎºÎÅÍ (±×¸®°í, Si-1 = si-1 À» °¨ÁöÇÑ ÈÄ), ÀÌ¹Ì Ei ÀÇ ¸ðµç °ª¿¡ ´ëÇØ (Ei | <values before t = 1>) ¸¦ °è»êÇÏ¿´´Ù.

2. ½Ã°£ t = i ¿¡¼­ Si = si ¸¦ °¨ÁöÇÏ°í ¼¾¼­ ¸ðµ¨À» ÀÌ¿ëÇؼ­ Ei ÀÇ ¸ðµç °ª¿¡ ´ëÇØ (Si = si | Ei) ¸¦ °è»êÇÑ´Ù.

3. Çൿ ¸ðµ¨·ÎºÎÅÍ Ei ¿Í Ai ÀÇ ¸ðµç °ª¿¡ ´ëÇØ   (Ei+1 | Ai, Ei) ¸¦ °è»êÇÑ´Ù.

4. Ai ÀÇ °¢ °ª°ú Ei+1 ÀÇ Æ¯Á¤°ª¿¡ ´ëÇØ   (Ei+1 | Ai, Ei) (Si = si | Ei) (Ei | <values before t = i>) ÀÇ °öÀ» Ei ÀÇ ¸ðµç °ª¿¡ ´ëÇØ ´õÇÏ°í, »ó¼ö ¸¦ °öÇؼ­ (Ei+1 | <values before t = i>, Si = si | A i) ¿¡ ºñ·ÊÇÏ´Â °ªÀ» ¾ò´Â´Ù.

5. ¹Ù·Î Àü ´Ü°è¸¦ Ei+1 ÀÇ ¸ðµç °ª¿¡ ´ëÇØ ¹Ýº¹ÇÏ¿© Ei+1 °ú A i ÀÇ °¢ °ª¿¡ ´ëÇØ (Ei+1 | <values before t = i>, Si = si | A i) ÀÇ ½ÇÁ¦ °ªÀ» ¾òÀ» ¼ö ÀÖµµ·Ï »ó¼ö ¸¦ °è»êÇÑ´Ù.

6. ÀÌ È®·ü°ªµéÀ» ÀÌ¿ëÇؼ­ Ai ÀÇ °¢ °ª¿¡ ´ëÇÑ Ui+1 ÀÇ ±â´ëÄ¡¸¦ °è»êÇÏ°í ±â´ëÄ¡¸¦ ÃÖ´ëÈ­ÇÏ´Â Ai ¸¦ ¼±ÅÃÇÑ´Ù.

7. ÀÌÀü ´Ü°è¿¡¼­ ¼±ÅÃµÈ ÇൿÀ» ¼öÇàÇÏ°í, i ¸¦ Çϳª Áõ°¡½ÃŲ ÈÄ À§ °úÁ¤À» ¹Ýº¹ÇÑ´Ù.

ÀÌ°ÍÀÌ ¹Ù·Î µ¿Àû °áÁ¤ ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇؼ­ ÇൿÀ» ¼±ÅÃÇÏ´Â ÇÙ½É °úÁ¤ÀÌ´Ù. ÀÌ ¹æ¹ýÀº À§¿Í °°Àº ½¬¿î ¿¹Á¦ ÀÌ»óÀÇ ¿¹Á¦¿¡µµ È®ÀåµÈ´Ù. ÇൿÀÌ È¯°æ¿¡ ¹ÌÄ¡´Â ¿µÇâÀ̳ª ȯ°æÀÌ ¼¾¼­ Àڱؿ¡ ¹ÌÄ¡´Â ¿µÇâµéÀº ÀϹÝÀûÀ¸·Î ±×¸² 5 ¿Í À¯»çÇÑ ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇÏ¿© Àß ¸ðµ¨¸µµÉ ¼ö ÀÖ´Ù. °¢ ½ÃÁ¡¿¡¼­ ´ÜÀÏ È¯°æº¯¼öÀÎ Ei ´ë½Å¿¡ °ª º¤ÅÍÀÎ Ei = (Ei1, ..., Ein) À» ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù. ÀÌ¿Í ºñ½ÁÇÏ°Ô, ´ÜÀÏ °¨Áöº¯¼öÀÎ Si ´ë½Å¿¡ °ª º¤ÅÍÀÎ Si = (Si1, ..., Sim)À» ÀÌ¿ëÇÒ ¼ö ÀÖ´Ù. ¹°·Ð °¢ ½ÃÁ¡¿¡¼­ÀÇ µ¿Àû °áÁ¤ ³×Æ®¿öÅ©´Â ÀÌ·± ¸ðµç º¯¼ö¿Í Á¾¼Ó¼º¿¡ ´ëÇÑ ³ëµå¸¦ Æ÷ÇÔ½Ãų ¼ö ÀÖµµ·Ï È®ÀåµÇ¾î¾ß ÇÏÁö¸¸, ÀϹÝÀûÀÎ °è»ê ÇüÅ´ ¾Õ¿¡¼­ °£´ÜÇÑ ¿¹Á¦¿¡ ´ëÇØ ÇÑ °Í°ú µ¿ÀÏÇÏ´Ù. ÁÖ¾îÁø ½ÃÁ¡¿¡¼­ ³»ºÎÀûÀÎ ³×Æ®¿öÅ©°¡ º¹ÀâÇÏ´õ¶óµµ ¸¶¸£ÄÚÇÁÀÇ °¡Á¤Àº ½ÃÁ¡ »çÀÌÀÇ Á¾¼Ó¼ºÀ» ´Ü¼øÈ­½ÃŲ´Ù.

ÇÑ ´Ü°è ÀÌ»óÀ» ³»´Ùº¸·Á¸é È®·üÀ» È¿¿ë°ª ±â´ëÄ¡°¡ °è»êµÇ´Â ÁöÁ¡±îÁö Àü´ÞÇØ¾ß ÇÑ´Ù. ´ç¿¬È÷ ÀÌ·¯ÇÑ È®ÀåÀº ±Ý»õ ºñÇö½ÇÀûÀÎ °ÍÀ¸·Î ³ªÅ¸³­´Ù. ´õ±¸³ª Ei ¿¡ ´ëÇÑ È®·ü ºÐÆ÷°¡ ¸Å¿ì ±¤¹üÀ§ÇÏ°Ô Èð¾îÁú ¼ö Àֱ⠶§¹®¿¡ À¯¿ë¼ºµµ ¶³¾îÁø´Ù. µû¶ó¼­ ÀÌ·¯ÇÑ È®·üÀû È®ÀåÀ» Á¦¾ÈÇϱâ Àü¿¡ ¾ð±ÞÇß´ø ´Ù¼Ò ÀÏ°ü¼ºÀÌ ¾ø´Â °¡Á¤À» Æ÷ÇÔÇÏ´Â ÀýÃæ ¹æ¹ýÀÌ ÇÕ¸®ÀûÀÎ ´ë¾ÈÀÌ µÉ ¼ö ÀÖ´Ù.

3. Âü°í¹®Çå ¹× Åä·Ð

º£ÀÌÁö¾È ³×Æ®¿öÅ©¿¡ ´ëÇÑ ÇнÀÀº ¸Å³â »õ·Î¿î Áß¿äÇÑ ³í¹®ÀÌ ¹ßÇ¥µÇ´Â È°¹ßÇÑ ¿¬±¸ ºÐ¾ßÀÌ´Ù. [Neal 1991 (Neal, R., "Connectionist Learning Of Belief Networks," Artificial Intelligence, 56:71-113, 1991.)] Àº ½Å°æ¸ÁÀ» ÀÌ¿ëÇؼ­ º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ ÇнÀÇÏ´Â ¹æ¹ýÀ» ±â¼úÇÏ¿´´Ù. Á¦½ÃµÈ º£ÀÌÁö¾È ³×Æ®¿öÅ© ±¸Á¶¸¦ Æò°¡Çϱâ À§ÇØ ÀÌ Ã¥¿¡¼­ ±â¼úµÈ ±â¹ýÀº ÃÖ¼Ò ÄÚµå±æÀÌ [Rissanen 1984 (Rissanen, J., "Universal Coding, Information, Prediction, and Estimation," IEEE Transactions on Information Theory, IT-30(4):629-636, 1984.)] ÀÇ °³³äÀ» ÀÌ¿ëÇÏ¿´´Ù. [Friedman 1997 (Friedman, N., "Learning Belief Networks in the Presence of Missing Values and Hidden Variables," Proceedings of the Fourteenth International Conference on Machine Learning (ICML '97), San Francisco: Morgan Kaufmann, 1997.)] Àº ³×Æ®¿öÅ©ÀÇ ±¸Á¶¸¦ ¾ËÁö ¸øÇÏ°í °á¿©µÈ µ¥ÀÌÅÍ°¡ Á¸ÀçÇÒ °æ¿ì¿¡ º£ÀÌÁö¾È ³×Æ®¿öÅ©¸¦ ÇнÀÇÏ´Â ±â¹ýÀ» ±â¼úÇÏ¿´´Ù. º£ÀÌÁö¾È ³×Æ®¿öÅ©ÀÇ ÇнÀ¿¡ ´ëÇÑ Ãʱ⠿¬±¸´Â [Cooper & Herskovitz 1992 (Cooper, G., and Herskovitz, E., "A Bayesian Method for the Induction of Probabilistic Networks 'from Data," Machine Learning, 9:309-347, 1992.)] ¿¡ ÀÇÇØ ÀÌ·ç¾îÁ³´Ù.

[Forbes, et al. 1995 (Forbes, J., Huang, T., Kanazawa, K., and Russell, S., "The BATmobile: Towards a Bayesian Automatic Taxi," in Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence (IJCAI-95), pp.1878-1885, San Francisco: Morgan Kaufmann, 1995.)] ´Â µ¿Àû °áÁ¤ ³×Æ®¿öÅ©¸¦ ÀÌ¿ëÇؼ­ ÀÚµ¿Â÷¸¦ ¿îÀüÇÏ´Â ½Ã½ºÅÛÀ» Á¦½ÃÇÏ¿´´Ù.

È®·üÀû »óȲ (stochastic situation) ¿¡¼­ÀÇ È¿¿ë¼º Æò°¡´Â °áÁ¤·Ð (decision theory) ºÐ¾ßÀÇ ÁÖµÈ °ü½É»çÀÌ´Ù. AI ¿¡¼­ °áÁ¤·ÐÀÇ ÀÌ¿ëÀ» ¾î¶»°Ô ´Ù·ç´ÂÁö¸¦ º¸·Á¸é [Horvitz, Breese, & Henrion 1988 (Horvitz, E., Breese, J., and Henrion, M., "Decision Theory in Expert Systems and Artificial Intelligence," International Journal of Approximate Reasoning, 2:247-302, 1988.)]À» ÂüÁ¶Ç϶ó. ¸¶¸£ÄÚÇÁ °áÁ¤ ¹®Á¦ (Markov decision problems, MDPs) [Puterman 1994 (Puterman, M., Markov Decision Processesm Discrete Stochastic Dynamic Programming, New York: John Wiley & Sons, 1994.)] ¿¡ ´ëÇÑ À̷аú ºÎºÐÀûÀ¸·Î °üÂû °¡´ÉÇÑ ¸¶¸£ÄÚÇÁ °áÁ¤ ¹®Á¦ (partially observable MDPs, POMDPs) [Cassandra, Kaelbling, & Littman 1994 (Cassandra, A., Kaelbling, L., and Littman, M., "Acting Optimally in Partially Observable Stochastic Domains," in Proceedings of the Twelfth National Conference on Artificial Intelligence (AAAI-94), pp.1023-1028, Menlo Park, CA: AAAI Press, 1994.)] ¿¡ ´ëÇÑ ÀÌ·ÐÀº È®·üÀû »óȲ¿¡¼­ ÇൿÀÇ °á°ú¿¡ ´ëÇÑ ±âº»Àû ÀÌ·Ð ¸ðµ¨À» Á¦°øÇÑ´Ù.