Machine  Translation

 

서로 다른 두 개의 자연어, 즉 영어와 한국어 사이, 혹은 일어와 한국어 사이의 번역을 컴퓨터와 소프트웨어가 자동적으로 해주는 것을 기계번역 (Machine Translation) 이라고 한다. 세계화 시대에 언어의 장벽을 없애고 국가간 경계를 허무는 결과를 초래하여 세계를 하나로 만들 것이다.

definition   term   site   paper  

컴퓨터의 최초의 비수치 (non-numeric) 응용 중의 하나는 기계 번역이었다. 이러한 번역 프로그램의 모델이 다음 그림에 주어져 있다.

 

원시언어 (source language) 의 문장은 대상언어 (target language) 의 문장으로 직접 대응되는데, 이는 원시언어-대상언어사전을 이용하며, 또 두 언어의 아주 간단한 문법구조의 모델을 이용하여 이루어진다 ....... 불행히도, 이 방법은 성공적이 못되었다. 한 문장을 어떤 언어에서 다른 언어로 번역하기 위해서는 먼저 문장의 의미를 이해하여야 하는데, 이를 소홀히 하는 시스템의 경우에는 다음과 같은 단점을 갖게 될 것이다.

한 문장을 어떤 언어에서 다른 언어로 번역하기 위해서는 먼저 문장의 의미를 이해하여야 하는데, 이를 소홀히 하는 시스템의 경우에는 여러 가지 기계번역의 문제점 을 보이게 된다. 예를들면  " The spirit is willing but the flesh is weak. (마음은 그렇지 않으나 육신이 약하도다 : 마태복음의 한 구절 : 마음과는 달리 쉽게 유혹을 뿌리칠 수 없다는 뜻을 가짐)" 라는 영어 문장이 러시아어로 번역되고, 그 러시아어를 다시 영어 문장으로 번역하여 보니  " The vodka is good but the meat is rotten. (보드카는 좋지만 고기는 상하였다) " 라는 전혀 엉뚱한 결과가 나온 예가 있다. 이것은 하나하나의 단어의 뜻으로 보면 그렇게 해석될 수 있는 여지도 있는 것이다. ...........

이미 우리가 생각한 바와 같이 이를 해결하기 위해서는 원시언어의 문장을 이해하고, 이를 대상언어로 나타내어야 하는 것이다. 이러한 방식이 다음 그림에 나타나 있다.

 

현재 기계 번역은 이러한 방식에 의한 연구가 대부분이다...........

유럽과 미국에서는 기계번역 시스템에 의한 번역이 비교적 오래되었다. 기계번역을 가장 필요로 하는 곳은 국제연합(UN)과 EC 등 국제기관이었다. EC에서는 1982년에 이미 라메테크사가 개발한 SYSTRAN이라는 기계번역시스템을 도입하여 각종 언어간(영어, 불어 등)의 번역에 사용하고 있다. 당시 EC에는 12개국이 가맹되어 있으며 9가지 언어를 공식어로 사용하고 있었다. 따라서 조합하면 81개의 번역작업이 필요하게 된다. EUROTRA라고 부르는 9개 언어간, 81방향의 번역을 행하는 언어자동번역 시스템 개발에 착수하였다. 이후 여러나라에서 시스템이 개발되었고 한국에서는 1985년 한국과학기술연구원 시스템공학연구소에서 기계 번역 시스템 개발을 시작하였다. ...........

video :

(전문가 토크 릴레이) 인공지능과 자동번역 기술 : 솔트룩스 : 이경일 대표이사, 2015/11/11