효용이론 : Utility Theory

Utility Theory

........... 심리학 이론인 주관적 기대효용이론 (Subjective expected utility theory) 에 의하면 사람들은 의사결정시 자신에게 유익한 것 (positive utility) 이 최대로 되는 것이나 해가 되는 것 (negative utility) 이 최소로 되는 것을 일반적으로 선택한다고 한다. Keyboard 의 예에서는 DVORAK 자판의 경우,QWERTY 자판보다 사용이 편리하다는 장점 (positive utility) 이 있는 반면, 새롭게 학습할 필요 (negative utility) 가 있다는 단점도 있는데, 일반적으로 사람들은 사용성이 증가된 positive utility 보다 새롭게 학습해야 하는 노력인 negative utility 가 더 크다고 판단하기 때문이라고 설명할 수 있을 것이다 .............

............. 효용성으로 표현되는 선호 (preference) 는 결정이론 (Decision Theory) 라고 불리는 합리적인 의사결정의 일반이론에서 확률과 결합된다 :

결정이론 (Decision Theory) = 확률이론 (Probability Theory) + 효용이론 (Utility Theory)

결정이론의 기본적인 개념은 행동의 모든 가능한 결과에 대해 평균해서, 만일 가장 높은 기대 효용 (expected utility) 을 낳는 행동을 선택한다면 그럴 때에만 그 에이전트는 합리적이다 라는 것이다. 이것은 기대효용 최대화 (Maximum Expected Utility, MEU) 의 원리 라고 부른다 ................

행동의 귀결이 불확실한 상황에서 합리적인 경제주체의 판단은 결과에 관한 효용의 기대치에 입각하여 이루어진다는 이론. ...... 기대효용가설(期待效用假說)이라고도 한다. 1730년경 스위스의 물리학자 D.베르누이는, 사람은 화폐에 관해 한계효용이 체감하는 효용함수를 갖고 있으며 도박의 수학적 기대치에서라기보다 도박이 가져오는 효용의 수학적 기대치, 혹은 기대효용을 판단의 기준으로 한다는 가설에 의해 이득의 기대치가 무한대인 도박이라도 실제로는 그 도박에 거금을 내고 참가하는 사람은 없다는 소위 ‘상트페테르부르크의 역설’을 설명하려고 했다.

1950년대에 들어 V.노이만과 O.모르겐슈테른 등이 이 가설에 엄밀한 공리체계(公理體系)로 뒷받침하였다. 그 후 기대효용이론은 게임 이론 (Game Theory) 과 밀접히 결부되어 발전하였으며, 경제이론에서도 M.프리드만과 J.새비지는 기수적(基數的) 효용에 관한 한계효용체감(체증)성이 위험회피(애호)를 의미한다는 것을 명백히 하고, K.애로와 W.프래트는 기수적 효용함수의 성질에 입각한 위험회피도의 정의에 성공하는 등, 마르코비츠 이후의 자산선택이론을 비롯해 불확실성 하에서의 선택 및 경제제도의 일반균형적 분석에 있어서 중심적 역할을 하기에 이르렀다. ........... (Yahoo 백과사전 : 기대효용이론)

불확실성의 존재는 에이전트가 의사결정 하는 방법을 철저히 변화시킨다. 논리적 에이전트는 전형적으로 하나의 목표를 가지고 있고 그것의 성취가 보장된 어떤 계획을 수행한다. 그 목표를 성취할 수 있는지 여부에 기초해서, 다른 행동이 성취할 수 있는 것과는 무관하게, 하나의 행동이 선택되기도 하고 거절되기도 한다. 불확실성이 개입하게 되면 완전히 다른 case 가 되는 것이다. 다시한번 공항으로 가려고 하는 계획 (비행기를 타기위해 90 분전에 출발) 을 고려해 보자. 그것이 95 % 의 성공 기회를 가진다고 가정하자. 그것이 합리적인 선택을 의미하는가? 반드시 그런 것은 아니다 : 다른 계획, 예를들면 같은 것이 더 높은 성공확률을 가질 수 있다. 비행기를 절대로 놓치지 않는 것이 중요하다면, 공항에서 더 오래 기다리는 위험을 감수할만 하다. 미리 24 시간 전에 집에서 출발하는 계획인 는 어떤가? 대부분의 경우에 그것은 좋은 선택은 아니다. 왜냐하면 비록 제시간에 도착한다는 것을 거의 보장하지만, 그것은 참을 수 없는 대기시간을 포함하기 때문이다.

그런 선택을 하려면, 에이전트는 먼저 여러 가지 계획의 다른 가능한 결과물들 사이의 우선순위 (또는 선호, preferences) 를 가져야 한다. 하나의 특별한 결과물 (outcome) 은 에이전트가 제 시간에 도착할 것인지, 공항에서 기다리는 시간의 길이는 어떤지와 같은 factor 를 포함하는 완전히 특별한 상태이다. 우리는 우선순위를 가지고 표현하고 추론하는 효용이론 (Utility Theory) 을 사용할 것이다. (utility 라는 용어는 여기서는 전기회사 또는 water works 같은 의미가 아니라 "유용한 질 (the quality of being useful)" 의 의미로 사용된다. 효용이론은 모든 상태는 에이전트에게 유용성 또는 효용성의 정도 (a degree of usefulness or utility) 를 가지고 있으며, 그 에이전트는 더 높은 효용성을 가진 상태를 선호할 것이라는 이론이다. ......... (Stuart Russell 2003)

term :

결정이론 (Decision Theory) 효용이론 (Utility Theory) 경제학 (Economics) 심리경제학 (Behavioral Finance) 경제 (Economy) 인공지능 (Artificial Intelligence) 심리학 (Psychology) 확률이론 (Probability theory) 불확실성 (Uncertainty) 의사결정 (Decision Making) 경영과학 (Operation Research) Gerald Debreu

site :

Decision Making : 연세대 심리학과 이주환 HCI study

다니엘 카네만 : KAIST Times

paper :

불확실성과 합리적 결정 : Stuart Russell Peter Norvig

카네만과 트베르스키의 비판 : 정영기 : ...... 의사결정이론적 합리성은 기대효용 (expected utility) 이론에 기초하고 있다. 기대효용 이론에 의하면 합리적 행위는 기대 효용을 최대화하는 행위이다. 다시 말하면 의사결정자의 목적과 일치하며 의사결정자가 기대한 만족을 최대화하는 행위가 합리적 행위이다 (주석 : 의사결정의 주관적 기대효용이론에 의하면 불확실성 하에서 최적의 행위는 정보의 두 가지 수준에서 행해진다. 두 가지는 효용과 확률이다. 효용은 행위자가 가능한 선택들에 부여한 상대적 평가이다. 확률은 가능한 선택들이 실제로 발생할 수 있는 가능성이다.). 헴펠도 위험하의 의사결정에서 합리적 행위의 기준으로서 기대효용 최대화의 기준을 제시하고, 불확실성 하의 의사결정에서 합리적 행위의 기준으로서 최소극대화의 규칙을 제시한다.

어느 행위를 선택할 것이냐의 문제는 어떤 사태가 일어날 것인가의 문제에 달려 있으며 또한 그 행위가 초래할 결과들이 어느 정도 바람직하냐에 달려 있다. 따라서 행위 결단은 인식 근거에 의거한 자연 상태에 대한 사실판단과 평가 근거에 의거한 가치판단이 조화를 이루게 될 때 비로소 합리적으로 수행될 수 있다. 이와 같은 의사결정의 합리적 기준으로 제시된 것이 기대효용 최대화의 원리이다 (주석 : 이초식 (1985), "의사결정의 논리" <<논리연구-현안 김준섭 박사 고희기념>>, 문학과 지성사. 1831면.).

Herbert A. Simon 에 의하면 기대효용 이론은 다음과 같이 네 가지를 전제하고 있다. 첫째, 의사결정자는 잘 정의된 효용 함수를 갖고 있으며 특정한 사건에 대한 호감의 측정으로써 수치를 할당할 수 있다. 둘째, 의사결정자는 일련의 대안들에 직면해 있다. 셋째, 의사결정자는 모든 미래의 사건에 대해 일관된 확률분포를 할당할 수 있다. 넷째, 의사결정자는 일련의 사건들의 기대효용을 최대화하는 대안을 선택할 것이다.

사이먼은 기대효용이론을 매우 강하게 비판한다. 기대효용이론은 의사결정자가 자신 앞에 놓여있는 모든 것들을 포괄적으로 이해하고 있으며, 그 순간만이 아니라 미래의 순간에 자신에게 열려져 있는 모든 대안들을 이해하고 있다고 가정한다.

기대효용 이론은 여러 가지 난점을 지니고 있다. 의사결정에서 기대효용이론은 심리학적 근거에서 도전을 받는다. 기대효용이론은 의사결정자가 고정되고 알려진 대안들 가운데 선택하는 이론인데, 이 경우 각각의 대안에는 알려진 결과가 할당된다. 그러나 의사결정자와 객관적인 환경 사이에 지각과 인지가 개입하게 되면 기대효용 모델은 더 이상 적절하지 않게 된다. 인지심리학은 의사결정의 경험적 연구에 많은 영향을 미치고 있다.

개인이 안정적으로 선호하고 그 선호 (preference) 가 정확하게 측정된다면 그 선호는 동일한 선택 문제에서 불변적일 (invariant) 것이다. 그러나 많은 연구들은 그 불변성이 존재하지 않는다는 것을 보여주었다. 선호는 선택문제가 기술되고 구조지어지는 방식에 따라 그리고 선택이 표현되는 반응양식에 따라 민감하게 반응한다. 카네만 (D.Kahneman) 과 트베르스키 (A.Tversky) 는 이것을 잘 지적하고 있다. 한 가지 예를 들어보자.

문제 1.

미국은 600 명이 죽을 것으로 예상되는 이상한 질병을 대비하고 있다. 이 질병에 대응하려는 두 가지 대안이 제시되었다. 그 프로그램의 결과에 대한 과학적인 예상이 다음과 같다고 가정하자.

프로그램 A 가 선택되면 200 명이 구조될 것이다.

프로그램 B 가 선택되면 600 명이 구조될 확률은 1/3 이고 한 사람도 구조되지 못할 확률은 2/3 이다.

문제 1 에서 대부분의 선택은 위험 회피 (risk averse) 이다. 확실하게 200 명을 구조한다는 전망은 600 명을 구조하는 1/3 의 확률보다 더 매력적이다.

문제 2

동일한 문제에 대해 다음과 같은 결과가 나왔다고 가정하자.

프로그램 C 가 선택되면 400 명이 죽을 것이다.

프로그램 D 가 선택되면 어느 누구도 죽지 않을 확률은 1/3 이고 600 명이 죽을 확률은 2/3 이다.

문제 2 에서 대부분의 선택은 위험 감수 (risk taking) 이다. 400 명의 확실한 죽음은 600 명이 죽을 2/3 의 확률보다 덜 매력적이다. 이익을 포함하는 선택은 종종 위험 회피이고 손실을 포함하는 선택은 종종 위험 감수이다. 두 문제의 유일한 차이는 문제 1 에서는 결과가 구조된 사람 수에 의해 표현된 반면 문제 2 에서는 결과가 죽은 사람 수에 의해 표현되었다.

두 문제는 형식적으로 동일한 반면 그 문제가 야기하는 선호는 전혀 다를 수 있다. 대학생을 대상으로 한 연구에서 72 % 는 프로그램 B 보다 프로그램 A 를 선택하였으며 78 % 는 프로그램 C 보다 프로그램 D 를 선택하였다. 카네만과 트베르스키는 이익과 손실에 대한 심리학적 지각을 표현하는 가치함수를 언급함으로서 선호의 반전 (reversals of preference) 을 설명한다. 즉, 손실에서 입는 상처의 정도가 이익에서 얻는 기쁨의 정도보다 더 크고 심하다는 것이다. ........