Statistics

          

인공지능 (Artificial Intelligence) 연구는 크게 보아 두가지 접근 방법에 의해 이루어진다고 볼 수 있다. 첫째는 기호주의 방식이다. 이 방법에서는 주어진 문제에 대하여 기본이 되는 개념, 이들간의 관계 및 제약조건, 구체적인 사실들을 정해진 기호체계 내에서 기호들의 집합으로 표현한후, 이 기호들을 적절히 변형하고 조작함으로써  추론, 의사결정, 학습등을 수행할수 있다고 보는 것이다. 두 번째 방법은 연결주의 방식이다. AI 을 실현하기 위해서는 학습이나 언어, 인식이나 감각의 본질에 대한 이해가 필요하며, 인간의 두뇌를 모방한 신경망 (Neural Network) 을 구성하여 정보처리의 최소 단위인 신경세포 (Neuron) 들의 협동적, 경쟁적 상호작용을 하도록 하여 전체적이고 종합적인 정보처리를 해야 한다고 보는 견해이다. AI 연구에서의 두가지 접근방법 중에서 기호주의 방법에서 통계학이 많이 사용되고 있다. 특히 전문가시스템 (Expert System) 에서의 불확실성 (Uncertainty) 처리문제와 Bayesian 학습방법, 패턴인식 (Pattern Recognition) 분야 연구에서 Bayes 이론이 중요한 역할을 한다.

term   paper   site    lab   history   확률 (Probability)

전문가시스템 (Expert System)에서 사용되는 불확실성 (Uncertainty) 하에서의 추론 (Reasoning) 은 불확실성의 표현, 결합 및 전파방법에 따라 크게 정성적 (qualitative, non-numeric) 방법과 정량적 (quantitative, numerical) 방법으로 구분한다. 정성적 방법에서는 불확실성을 언어적 용어 (linguistic term)를 사용하여 표현하는데 McDermott & Dole 의 "기본값 추론 (Default Reasoning)", Kleer 의 "가정에 근거한 진리유지방법 (ATMS)", Cohen 의 "Endorsement" 방법 등이 있다. 이 방법들에서는 언어적 용어를 사용함으로써 어떤 사건, 규칙, 가설 등에 대해 특정 전문가의 주관적인 불확실 정도가 다른 사람에게 객관적으로 전달될 수 있다. 그러나 언어 자체의 모호성에 의해 불확실 증거를 결합하는 규칙을 정의하기가 매우 어렵고 수학적 기반이 약하여 실제 문제 영역에 적용되지 못하고 대부분 연구상태에 머물고 있다. 정량적 방법에서는 불확실성을 단일값, 또는 [하한, 상한] 의 범위 값으로 표현하여 추론과정을 거치면서 불확실성을 표현한 값인 불확실도를 전파하고 결합하는 방법이다. 여기에는 Bayesian 방법, 확신도 (Certainty Factor) 방법, Dempster-Shafer 증거이론 (Theory of Evidence) 방법, 퍼지 (Fuzzy) 추론방법 등이 있다...

AI 프로그램에 필요한 지식베이스는 지식공학자 (Knowledge Engineer) 가 전문가를 인터뷰하는 과정을 통해서 구축되는데, 이러한 과정의 많은 부분은 기계학습에 의해 해결될 수 있다. 기계학습 (Machine Learning) 에는 주어진 예제로부터 이들이 암시적으로 표현하고 있는 개념을 추출해내는 귀납적 방법 (inductive method, similarity-based learning), domain 이론에 근거하여 하나의 주어진 예제를 설명하면서 개념적인 domain 지식을 보다 구체적이고 활용성 있는 지식으로 변화시키는 연역적 방법 (deductive method, explanation-based learning), 일정한 분야에 적용할 수 있는 대표적인 사례들을 기억하고 있다가 새로운 문제를 해결하는 과정에서 유사한 사례를 이용하여 문제를 해결하는 사례기반 학습 (case-based learning) 등이 있다. 귀납적 방법에서 확률이론은 데이터베이스로부터 믿음 네트워크 (belief network)를 생성하는 Bayesian 학습방법에 사용된다.

패턴인식 (Pattern Recognition) 의 마지막 단계인 패턴분류 (pattern classification) 는 미지의 패턴이 주어졌을 때 그 패턴이 어느 범주에 속하는가를 결정하는 것이다. 패턴분류 방법은 크게 통계적 접근방법, 구문론적 접근방법, 신경망을 이용한 접근방법이 있다. 통계적 접근 방법은 통계적인 가정에 바탕을 두고, 특징 벡터를 유한 개의 부류들 중의 하나로 배정한다. 결정함수 사용방법, 거리함수에 의한 방법, 베이즈 정리 (Bayes' Theorem) 이론에 의한 방법, 은닉 마르코프 모델 (Hidden Markov Model) 에 의한 방법이 있다.

연결주의 방법으로는 볼쯔만 머신 (Boltzmann Machine) 이 상호결합형 홉필드 네트워크 (Hopfield Network) 신경망 모델과 같은 구조를 가지면서 확률적 상태이전을 하는 신경망 모델이다.

통계학의 방법론을 기존의 불확실성을 다루는 분야, 패턴인식 분야만이 아니라 다른 AI 분야, 예를들어 요즈음 많은 관심을 끌고 있는 응용분야인 데이터베이스로부터 지식을 추출하는 문제 (Knowledge Discovery in Database 또는 데이타 마이닝 (Data Mining) 등에 적용시킴으로써 좋은 결과를 얻을 수 있으리라 생각된다 ................ (인공지능 연구에서의 통계적 방법 (Statistical Methods in Artificial Intelligence Research) : 차운옥, 한국통계학회, 1996)

video :

21회 세상을 바꾸는 통계수학으로 푸는 세상의 비밀 - YTN 사이언스 : 박경미 수학스토리텔러 홍익대교수, 2014/04/04