Parsing

 

컴퓨터과학에서 파싱 (Parsing) 은 일련의 문자열을 의미있는 토큰 (token) 으로 분해하고 이들로 이루어진 파스 트리 (parse tree)를 만드는 과정을 말한다. ... 위키백과 : 구문분석

문장을 문법적인 유도를 통하여 설명하는 것은 자연 언어를 공부한 우리들에게 익숙하고, 이 과정을 파싱 (parsing) 이라 부른다. 파싱은 문장의 구조를 표현하는 한 방법이다. 예를 들어, 한 언어를 다른 언어로 번역하는 데에서와 같이 문장의 의미를 이해하는 것을 필요로 할 때에 항상 파싱은 중요한 역할을 한다. 컴퓨터 과학에서는, 번역기 (interpreter), 컴파일러 (compiler), 그리고 또 다른 프로그램 번역 등이 이와 연관된다. ......

parsing은 입력 문장에서 단어들의 기능이 문법규칙에 맞는가를 분석하는 것이다. 이를 위해 주어진 문장이 어떻게 출발 심볼로부터 생성되었나를 알아야 한다. 이를 위해서는 top-down and bottom-up parisng 이 존재한다.

문장에서 단어들의 선형적 순서는 서로간에 어떻게 관계되는지를 보여주는 구조로 변형된다. parser 는 문장에서 단어들의 리스트를 "de-linearization" 시켜서 문장의 구조적 의미를 표현하기위한 트리 (derivation tree) 형식으로 변환한다. 대표적인 parsing 기법에는 context free grammar   Augmented Transition Networks   Conceptual parsing (CD) 등이 있다.

다음 그림과 같이 parsing 에서는 주어-동사, 동사-목적어 등과 같은 중요한 언어학적인 관계를 형성함에 의하여  parser tree 로 표현된다, 단어 분석기(parser)에서는 Semantic analysis 에 대한 기반을 제공한다.

                  

term :

파싱 (Parsing)    문법 (Grammar)     언어학 (Linguistics)    전산언어학 (Computational Linguistics)     자연어처리 (Natural Language Processing)      인공지능 (Artificial Intelligence)     언어 (Language) 

site :

AI Topics : Grammars & Parsing

Wikipedia : Parsing     위키백과 : 구문분석

paper :

파싱과 모호성 : Peter Linz