AlphaGo

 

알파고 (AlphaGo) 는 구글 딥마인드 (Google DeepMind) 가 개발한 컴퓨터 바둑 (baduk) 프로그램이다. 2015년 10월 핸디캡 없이 프로 바둑 기사를 이긴 최초의 컴퓨터 바둑 프로그램이다.... ... 알파고는 수많은 기보 데이터를 토대로 '강화학습 (Reinforcement learning)' 이라는 시행착오 (Trial and Error) 과정을 거쳐 스스로 대국을 하며 실력을 키운다.  이런 프로세스틀 통해 바둑의 무한한 경우의 수를 계속 줄여나가 최적의 답을 찾는 것이다... (Demis Hassabis, 2016)

당대 최고의 바둑기사 이세돌과 커제를 연파한 알파고는 은퇴를 선언하고 마지막으로 알파고끼리 스스로 대국한 기보 50개 (AlphaGo vs AlphaGo : self play 50 matches) 를 남기고 사라졌다.

알파고는 프로기사 와의 공식대국에서 64승 1패의 전적을 남겼다. 이세돌과의 4국에서 유일하게 패배하여 3승 1패를 기록한 직후에 알파고 개발자인 Demis Hassabis 의 얼굴은 일그러졌다. 어떤 기자가 하사비스 에게 " 만일 알파고가 환자를 진단하는 일을 수행할 때 3승 1패 정도의 확률로 진단한다면 사용할 수 없는 것 아닌가?" 라고 질문하였고 하사비스는 "알파고가 아직 시제품이며 수년 후에는 확률이 개선될 것이다" 라고 하였다. 하사비스는 확신을 가지지 못하는 표정이었다. 그러나 이세돌과의 대국이후 1년도 되지 않은 시기에 프로기사와 두어진 모든 대국을 완벽하게 승리하면서, 알파고에게 적용된 학습 방법은 그 성능을 인정받게 되었다.

site :

Wikipedia : AlphaGo    위키백과 : 알파고    AlphaGo : Home   

matches :

AlphaGo vs 이세돌 5번기 : Korea   AlphaGo 대국 : 한국어   AlphaGo vs 커제 3번기 : China     AlphaGo vs AlphaGo : self play 50 matches    

term :

AlphaGo    Demis Hassabis     바둑 (baduk)   인공지능 (Artificial Intelligence)    학습 (Learning)     기계학습 (Machine Learning)     딥 러닝 (Deep Learning)   강화학습 (Reinforcement learning)    신경망 (Neural Network)    추론 (Reasoning)   문제해결 (Problem Solving)   게임 (Game)

paper :

Mastering the game of Go with deep neural networks and tree search

video :

인공지능과 미래 - Demis Hassabis : Jmagic1209 : Demis Hassabis, 2017/05/27

 

AlphaGo vs 커제 3국 : tvbaduk : 2017/05/28

 

AlphaGo vs Ke Jie - match 1- : DeepMind : 2017/05/23 ... playlist 3 (match 1~3)

 

이세돌 vs 알파고 4국 - 이세돌 승리후 인터뷰 : pantasim : 이세돌, 하사비스, 실바, 2016/03/13

 

이세돌 vs 알파고 4국 Full ver : SportsNewsKorea : 2016/03/13

 

이세돌 vs 알파고 2국 ep1 : tvbaduk : 2016/03/10 ... 동영상 23개 (2국~5국)

 

AlphaGo vs Lee Sedol - Match 1 : DeepMind : 2016/03/09 ... playlist 5 (Match 1~5)

 

article :

알파고의 다음 행마는? : 사이버오로, 2017/05/28  ... AlphaGo's next move

최초공개!  알파고 셀프 대국 1~10국 하이라이트 : 사이버오로, 김성룡, 2017/05/28 ... AlphaGo vs AlphaGo : self play 50 matches

알파고 vs 이세돌 감동, 다큐멘터리로 재현한다 - Greg Kohs 감독 :  조선일보, 이홍렬, 2017/04/04

알파고 시대의 바둑 랭킹 :  사이버오로, 배태일, 2017/02/28

알파고는 더없는 '바둑 선물' - 국가대표 팀이 말하는 알파고 바둑 2- : 사이버오로, 김수광, 2017/01/29

알파고가 우리에게 자유를 줬다 -국가대표 팀이 말하는 알파고 바둑 1- : 사이버오로, 박주성, 2017/01/27

기보없이 스스로 바둑 실력 키워 ... 더 똑똑해진 '알파고 2.0' 나왔다 : 중앙일보, 정아람, 2017/01/26

"알파고, 이세돌에 일부러 져줬을 것 ... 구글 사과해야" - 김진호 : 한국경제신문, 김봉구, 2017/01/12 ... video  ★★★

세계 최강 커제도 꺾었다, 더 세진 알파고 60전 60승 : 중앙일보, 정아람, 2017/01/05

알파고는 이세돌의 수를 이렇게 보았다 -2- : 사이버오로, 김수광, 2016/10/29

알파고는 이세돌의 수를 이렇게 보았다 -1- : 사이버오로, 김수광, 2016/09/24

이제 바둑 역사는 알파고 이전과 이후로 나뉜다 : 사이버오로, 감동근, 2016/03/27

알파고와의 대국, 창의력 아니라 계산서 승패 갈렸다 : 사이버오로, 문용직, 2016/03/25

알파고 바람, 학계 연구로 이어진다 - 한국바둑학회 '인공지능 시대의 바둑의 미래' : 사이버오로, 2016/03/17

속보 / 이세돌 승리, 인공지능 알파고 '항서' : 사이버오로, 김수광, 2016/03/13

이세돌 "인공지능이 이기는 날 오겠지만 바둑의 아름다움은 이해 못해" : 사이버오로, 김수광, 2016/03/08

문병로 서울대 교수 "이세돌, 판을 흩트리면 낙승, 끝내기로 가면 패" :  조선일보, 류현정, 2016/03/07

정두석 KIST 선임연구원 "첫 대국 이세돌 승 ... 5번째는 장담 못해" :  조선일보, 김민수, 2016/03/07

김석원 SW 정책연구소 책임연구원 "변칙 플레이로 흔들어도 알파고는 계산대로만 움직일 것" : 조선일보, 류현정, 2016/03/07

정수현 명지대 교수 "알파고, 이창호 9단과 스타일 유사 .. 이세돌 9단 4대 1로 승리할 것" : 조선일보, 강인호, 2016/03/07

이세돌 : 알파고, 누가 이길까? :  사이버오로, 배태일, 2016/03/06   

"알파고, 이세돌에 완승할 것 ... 구글의 인공지능 과시 쇼"- 김진호 : 중앙일보, 정아람, 2016/02/25   ★★★★★★★★★

"꼼수 안통하는 알파고, 5년 뒤엔 세계 최고수 이길 것" - 데미스 하사비스 : 중앙일보, 손해용, 2016/02/24

구글 딥마인드 챌린지 매치, 프레스 브리핑 질의응답 : 사이버오로, 김수광, 2016/02/22

스스로 바둑을 깨달은 인공지능 '알파고' - 2 : 사이버오로, 김수광, 2016/02/20

스스로 바둑을 깨달은 인공지능 '알파고' - 1 : 사이버오로, 김수광, 2016/02/18

'AlphaGo' 와 이세돌 9단의 대결에 부쳐 ... 네번째 : 사이버오로, 감동근, 2016/02/16

'AlphaGo' 와 이세돌 9단의 대결에 부쳐 ... 세번째 : 사이버오로, 감동근, 2016/02/10

'AlphaGo' 와 이세돌 9단의 대결에 부쳐 ... 두번째 : 사이버오로, 감동근, 2016/02/07

'AlphaGo' 와 이세돌 9단의 대결에 부쳐 ... : 사이버오로, 감동근, 2016/02/02   ★★★

 

... 직관을 가진 인간은 척 보면 둬야 할 수와 두지 말아야 할 수를 안다. 반면 컴퓨터는 쓸데없는 수까지 계산한다. 알파고는 계산할 필요 없는 수를 최대한 버려 탐색의 범위를 획기적으로 줄였다. 기계학습법의 일종인 딥 러닝 (Deep Learning,여러개의 인공신경망을 활용한 기계학습법) GPGPU (일반 목적으로 쓰이는 그래픽칩) 의 발전 덕분이다. 수십 층에 달하는 인공 신경망 (Neural Network) 을 훈련하는 데는 엄청난 계산량이 필요한데, GPGPU 덕분에 가능해졌다. ... 슈퍼컴퓨터 (Supercomputer) 이 기상데이터를 처리할 때 작업 방식을 살펴보자. 하나의 명령으로 여러 개의 데이터를 처리한다. 명령을 통해 실시하는 작업 내용은 같고 데이터만 다르다. 이걸 단일명령다중데이터처리 (SIMD) 라고 한다. 그런데, 그래픽칩이 슈퍼컴과 비슷하게 그래픽을 처리해왔다. 서로 다른 화면 정보를 동시에 여기저기서 처리해 한번에 보여준다. 그래픽카드 원리가 조그마한 GPU (Graphics Processing Unit) 를 여러 개 써서 계산하는 것이다. 이걸 일반 목적의 계산에 사용하면 GPCPU가 되는 데, 계산 속도에 혁명적인 변화가 일어났다. 우리 연구실에서도 그래픽 보드 4개를 이용해 컴퓨터를 조립하니, 일반 PC보다 속도가 최대 300배까지 빨라졌다. 300일 기다려야 끝나는 작업이 하루만에 끝나더라. 옛날 같으면 100억원 주고 사야 할 슈퍼컴퓨터를 천만원으로 만들 수 있게 됐다. 알파고도 CPU뿐만 아니라 GPU를 쓴다. 딥러닝을 개발한 제프리 힌튼 (Geoffrey Hinton) 토론토대 교수팀도 GPGPU를 썼다. ... (문병로, 2016)

'AlphaGo' 와 이세돌 9단의 대결에 부쳐 ... : 사이버오로, 감동근, 2016/02/02 : 1996년, 나는 물리학 (Physics) 을 전공으로 선택했다. 뉴턴 역학은 라플라스 (Pierre Laplace) 가 “우주의 모든 입자의 위치와 속도를 안다면 우주의 미래를 예측할 수 있다”고 말한 것처럼 만물의 이치를 결정적으로 설명할 수 있을 것 같았고, 해밀턴 역학은 말초적인(외부에서 힘이 가해지면 즉각 가속도로 반응하므로) 뉴턴 역학에 비해 심지어 만물이 철학적으로 움직이는 것 같은 인상을 주는데 매료되었다. 그러나 이듬해 3학년이 되어 양자역학을 배우면서, 현상을 정확히 파악하면 미래를 예측할 수 있다는 결정론 (Determinism)  에 회의가 들었고, ‘우주의 모든 입자’는 커녕 입자수가 서너 개만 돼도 이들의 상호작용을 깔끔한 수식으로 풀어낼 수 없다는 데 크게 실망하고 방황했다. 그러던 중 우연히 TV에서 IBM의 체스 컴퓨터 ‘Deep Blue’가 세계 챔피언 개리 카스파로프(Garry Kasparov)를 역사상 처음으로 이기는 것을 보게 됐다. 나도 언젠가는 Big Blue (IBM의 별명)에서 슈퍼컴퓨터 (Supercomputer) 를 만드는데 참여하고 싶다는 막연한 꿈을 갖고 전자공학으로 전공을 바꿨다. 그리고 그로부터 10년 뒤인 2007년에 뉴욕의 IBM 연구소에 입사하게 된다.

당시 IBM은 체스 (Chess) 다음으로 퀴즈를 푸는 슈퍼 컴퓨터 ‘Watson’을 개발하고 있었고 나도 이 프로젝트에 간접적으로 참여했다. 체스는 경우의 수는 많지만, 규칙과 목표 자체는 단순한 게임 (Game) 이다. 컴퓨터 (Computer) 의 장점, 즉 극대화된 연산 능력이 빛을 발하기에 꼭 맞는 분야이다. 그러나 인간이 사용하는 자연어(natural language)는 규칙이 단순하지 않고, 같은 표현이라도 전체 맥락 (Context) 에 따라 의미가 달라지며, 온갖 비유와 역설적인 표현으로 가득 차 있어서 컴퓨터에게는 훨씬 어려운 분야로 여겨진다. 그러나 2011년 라는 퀴즈 쇼에서 Watson은 역대 최고의 출연자 두 명을 압도적인 차이로 물리친다. 퀴즈 쇼 당시 Watson은 인터넷에 연결되어 있지 않았지만, 출전 전에 백과사전 몇 세트와 위키피디아의 모든 페이지를 학습 (Learning) 한 결과를 방대한 메모리에 담고 있었다.

Watson은 66 문제를 맞췄고 9 문제를 틀렸다. 맞춘 문제들 중에는 비교적 단순한 사실을 묻는 문제들도 있었지만, 쉽지 않은 추론 (Inference) 이나 연상 (Association) 을 요구하는 문제들도 있었다. 예를 들면, ‘Also on your computer keys(컴퓨터 자판 위에도)’라는 제시어를 주고, “Proverbially, it’s where the heart is(마음이 머무는 곳-필자 의역)”라는 질문에 “Home.”이라고 답한 것처럼 말이다 (자판에 ‘Home’키가 있고, “Home is where the heart is”라는 구문이 있다). 그러나 인간 출연자가 쉽게 맞춘 것을 Watson은 틀리기도 했다. ‘U.S. cities’라는 제시어의 “Its largest airport is named for a World War II Hero; its second largest, for a World War II Battle.”라는 질문에 Toronto라고 답했는데 이는 캐나다의 도시다. 정답은 전쟁 영웅 O’Hare와 Midway 해전의 이름을 딴 공항들을 갖고 있는 시카고다. 나중에 Watson의 개발 책임자 Dave Ferruci는 미국에도 토론토라는 이름의 도시가 있고, 캐나다 토론토가 미 프로야구 아메리칸 리그에 속한 팀을 보유하고 있는 점 등이 Watson이 토론토를 걸러내지 못한 이유로 들었고, 또 다른 개발자 Chris Welty는 Watson이 “its second largest, for a World War II Battle”을 제대로 해석하지 못하고 ‘it’s (the) second largest’로 오해한 것 같다고 설명한 바 있다 (토론토는 뉴욕에 이어 북미에서 두 번째로 큰 공항을 갖고 있다). (상식 (Commonsense) 참조)

2011년 가을 IBM을 퇴사하고 귀국해서 아주대에서 교편을 잡으면서 컴퓨터의 하드웨어 분야를 연구하기는 하지만, 직접적인 슈퍼 컴퓨터 개발이나 인공지능 (Artificial Intelligence) 분야와는 한 발 떨어져 지냈다. 본업 외에 내가 가장 관심 있는 분야가 바로 바둑 (Baduk) 이다. 나는 한국기원 공인 아마 5단으로 2면기 내지 3면기로 두는 프로 사범님과의 지도 대국에서 넉 점으로는 지지 않을 자신이 있다. 넉 점으로 네댓 판 연승을 거둔 뒤로 최근에는 석 점에 두는데, 만약 이세돌 9단과 100만불이 걸린 바둑을 일대일로 둔다면 여섯 점에도 힘들 것 같다. 그런데 얼마 전 알파고 (AlphaGo) 소식을 듣고 깜짝 놀랬다. 지금까지 최고의 바둑 컴퓨터는 기껏해야 나와 비슷한 수준이었는데, 알파고는 (정상급과는 실력 차이가 많이 난다 하더라도 여하튼) 프로를 호선으로 이기고 이세돌 9단에게 도전한다니!

우선 알파고와 판후위의 기보를 찾아봤다. 흑백 어느 쪽이 사람이고 컴퓨터인지 나로서는 구분하기 어려웠다. 둘 다 나보다 기력이 세다는 것은 느낄 수 있었다. 이 둘을 구분할 수 있는지 여부는 인공 지능에서 매우 의미심장한 문제이다. “컴퓨터가 생각 (Thinking) 할 수 있는가?” 내지는 “컴퓨터가 지능을 갖췄는가?”라는 질문은 모호하다. ‘지능 (Intelligence) ’이 무엇인지 명확히 정의하기가 어렵기 때문이다. 그래서 인공 지능의 아버지로 꼽히는 앨런 튜링(Alan Turing, 영화 <이미테이션 게임>의 모델)은 ‘튜링 테스트 (Turing Test)’라는 것을 제안했다. 사람의 대화를 흉내 낼 수 있도록 만든 자연어처리 (Natural Language Processing) 컴퓨터가 있다고 하자. 이 컴퓨터가 사람 A와 대화한 지문을, 평가자인 또 다른 사람 B가 읽고 어느 쪽이 사람이고 어느 쪽이 컴퓨터인지 구별할 수 있는지를 따지는 것이 바로 튜링 테스트이다.

카카오톡이 나오기 전 MSN 메신저가 크게 유행했을 때, ‘심심이’라는 채팅하는 로봇(챗봇 (Chatterbot))이 있었음을 기억할 것이다. 심심이가 사람과 채팅한 기록을 아이디를 가리고 보더라도 금새 어느 쪽이 챗봇인지를 별로 어렵게 않게 구별해낼 수 있었다. 즉, 튜링 테스트에 따르면 심심이는 대화하는 지능을 아직 갖추지 못한 것이다. 튜링 테스트를 바둑에 적용하면, 알파고가 바둑 두는 지능을 갖췄느냐는 문제는 우리가 기보를 보고 알파고가 어느 쪽인지를 판별할 수 있는지 여부로 귀결된다. 이제 겨우 말하고 읽기 시작한 어린 아이가 대화문을 보고 어느 쪽이 심심이인지 찾아내기 어렵듯이, 기력이 약한 나로서는 알파고와 판후위를 구별하는 것이 당연히 어려울 것이다. 하지만 최근 세계 1인자로 인정되는 커제 9단이 인터뷰에서 밝힌 것처럼 초일류 기사들도 기보에서 알파고를 구별해내기 어렵다면, 기력과 무관하게 알파고는 “바둑 두는 지능을 갖췄다”라고 얘기할 수 있는 것이다.

알파고의 개발팀이 Nature에 발표한 논문 (Mastering the game of Go with deep neural networks and tree search) 에는 알파고와 판후위의 대결에 관해 좀 더 자세한 내용이 실려있다. 우선, 알파고는 판후위와 공식 대국 다섯 판 외에도 비공식 대국 다섯 판을 더 겨뤘다. 모두 중국룰(덤 7집반)을 적용하되, 공식 대국은 생각시간 각자 한 시간에 30초 초읽기 3회로, 비공식 대국은 생각시간 없이 30초 초읽기 3회만 갖고 뒀다. 일견 속기 대국일수록 컴퓨터가 유리할 것 같지만, 알파고는 공식 대국 다섯 판을 모두 승리한 반면 비공식 대국 다섯 판 중 두 판을 졌다. .... (의사결정 트리 (Decision Tree)  신경망 (Neural Network)   기계학습 (Machine Learning)    트리 (Tree)    탐색 (Search)  참조)

이 점에서 알파고가 포석 단계 이후에 착수를 결정할 때 수읽기에 과도하게 의존하는 것으로 보인다. 알파고의 수읽기는 아직 완벽할 수가 없다. 체스에서 컴퓨터가 사람을 이긴 것이 20년 전이고 컴퓨터의 연산 능력은 그 뒤로도 지금까지 매 2년마다 두 배씩 발전해왔지만 컴퓨터가 아직도 체스를 ‘완전히 풀어내’ 지는 못했다. 완전히 풀어낸다는 것은, 종국까지 모든 경우의 수를 따져서 각 장면에서의 최선의 수를 특정할 수 있다는 것이다. 즉, “흑백 모두가 최선으로 두면 몇 번째 수에 이르러 어느 쪽이 이긴다(또는 비긴다)”고 말할 수 있다는 것이다. 예를 들어, 15줄 바둑판에서 두는 (3-3, 4-4 제한 없는) 오목에서는 이미 1993년에 백이 어떻게 응수하더라도 선착하는 흑이 무조건 이길 수 있는 수순을 찾아냈다. 체스는 오목보다 경우의 수가 훨씬 많아서 이제 겨우 기물이 흑백 합해 6개 남아있을 때 배치에 관계 없이 모두 풀렸고, 7개 남은 경우가 일부 풀린 정도다. 체스도 32개의 기물로 처음 시작할 때부터 풀기에는 아직 까마득한 시간이 필요하고, 하물며 체스보다 경우의 수가 훨씬 많은 바둑에서는 정말로 요원한 일이다.

물론 알파고의 계산(수읽기) 속도는 사람(일류 프로라고 하더라도)을 압도하지만, 프로는 착수를 결정할 때 수읽기에만 전적으로 의존하지는 않는다. 즉, 프로는 바둑 이론, 형태에 따른 급소 또는 흔히 ‘감각 (Heuristic)’이라고 부르는 직관을 통해서 안될 법한 수는 일찌감치 가지치기 (Alpha-Beta Pruning) 하고 될 법한 수만 집중적으로 따져본다. 알파고는 아직 이런 면에서 한참 떨어지는 것으로 생각된다. 알파고의 프로그래머들이 변변찮은 바둑 실력을 가진 것은 차치하더라도, 추상적인 바둑 이론, 예를 들면 ‘입계의완’ (경계를 넘어갈 때는 천천히 행동하라, 즉 상대의 세력에 뛰어들 때는 너무 깊이 들어가지마라) 같은 것을 어떻게 컴퓨터가 이해할 수 있도록 기호화(수치화)할 것인가? 또, 사람은 바둑 책에서 공부한 맥은, 실전에서 ‘비슷한 형태’가 나오면 곧잘 적용할 수 있다. 책에 나왔던 예제와는 약간 다르긴 하지만 같은 맥락 (Context) 이라는 것을 인지 (Cognition) 하는 것이다.

이러한 인지 분야는 계산 분야와는 달리 컴퓨터가 매우 취약한 분야다. 사진을 보고 개와 고양이를 구별 (discrimination) 해내는 것은 다섯 살 된 어린 아이에게 아주 쉬운 일이다. 그런데 개와 고양이를 구분하는 기준을 컴퓨터가 이해 (Understanding) 할 수 있도록 한 번 만들어보라. 1) 고양이가 개보다 꼬리가 긴 편이다! -> 그런데 컴퓨터는 꼬리를 찾지 못한다. 2) 몸통에서 폭이 갑자기 좁아지는 부분이 꼬리다! -> 그럼 몸통은? …… 어찌어찌해서 겨우 컴퓨터가 꼬리를 찾을 수 있게 한다고 하더라도, 이런 규칙으로는 불행한 사고로 꼬리가 잘린 고양이는 절대 구분해내지 못한다 (컴퓨터비전 (Computer Vision) 참고). 그러나 우리 아이들에게는 이런 식으로 가르치지 않는다. 길 가면서 보이는 대로 이것은 고양이, 저것은 개 하는 식으로 몇 번 시범을 보여주면 아이들은 한 눈에 (직관 (Intuition)) 개와 고양이를 구분하는 것은 물론, 고양이가 개보다 꼬리가 긴 편이라는 특징도 파악한다 (통찰 (Insight)). 사람의 이러한 학습 방식을 머신 러닝 (Machine Learning) 기법이 흉내 내려고 하지만, 최신 기법을 적용해도 아직 컴퓨터의 정답률은 많이 떨어진다. 본론으로 돌아가면, 알파고는 바둑 이론이나 형태를 이해하지 못한 관계로, 수읽기 할 때 프로라면 처음부터 고려하지도 않았을 수들을 계산하느라 대부분의 연산 능력을 허비하므로 속기에서 오히려 약한 모습을 보인 것으로 생각된다. (전문가 (Expert) 참조)

알파고는 중반 이후 수읽기에 절대적으로 의존하는 것과는 달리 초반에는 기존 기보들을 통계 (Statistics) 적으로 분석한 결과를 이용하는 것으로 보인다. 우리나라에 오로, 타이젬 과 같은 대국 사이트가 있는 것처럼 주로 외국인들이 이용하는 KGS 라는 사이트가 있는데, 알파고는 KGS에서 벌어진 6-9단 유저들의 기보 16만 건에서 나타난 약 3천만 경우의 착점을 학습 (Learning) 했다고 논문에서 밝혔다. 명시적으로 밝히진 않았지만 논문 의 그림 5를 보면, 알파고는 초반 포석 단계에서 각 착점 위치 별로 16만 판의 데이터베이스를 바탕으로 승률 기대치를 계산해서 그 중 가장 높은 곳을 선택하는 것으로 보인다. 그나마 중반에는 상대가 착수한 지점 주위로 수읽기 할 곳이 어느 정도 한정되지만, 초반에는 범위가 너무 넓기 때문에 어쩔 수 없는 선택으로 생각된다.

이세돌 9단이 처음 몇 수를 귀 보다는 변이나 중앙에 착점 한다든지 해서, 프로 바둑에서 절대 나오지 않을 법한 포석을 들고 나온다면 알파고가 어떻게 대응할 지 몹시 궁금하다. 특히, 그런 상황에서 먼 곳에 축머리를 쓴다면 알파고가 초반에 망할 가능성도 있다고 생각한다. 한 번도 가본 적이 없는 길로 이끌고 감으로써 컴퓨터를 압도적인 기억 (Memory) 능력으로부터 무장해제시키는 전략은 1997년에 이미 카스파로프가 Deep Blue와 대결한 여섯 판 시리즈 중 첫 판에서 쓴 적이 있다. 체스의 첫 수로는 수십 가지가 가능하지만 실제로 많이 두어지는 것은 대개 네 가지라고 하는데 (바둑에서 화점, 소목, 외/고목 두는 것처럼) 카스파로프는 이를 벗어나 불과 3수 만에 적어도 프로 레벨에서는 한 번도 나왔을 것 같지 않은 포석을 만들었고 결국 그 판을 쉽게 이겼다.

또, 그 대결에서 Deep Blue 는 대세관에 취약한 모습을 보였다. 카스파로프가 폰(장기의 졸과 같이 앞으로 한 칸만 움직이는 기물로 점수는 1점, 그러나 상대 진영의 끝까지 진출하면 퀸, 룩, 비숍, 나이트 등으로 프로모션 할 수 있다)들의 진출을 묶고 있던 Deep Blue의 비숍(대각선으로 움직이는 기물로 점수는 3점)을 제거하기 위해 자신의 룩(장기의 차와 같이 직선으로 움직이는 기물로 점수는 5점)을 미끼로 내걸었을 때 Deep Blue는 여기에 걸려 들었다. 보다 점수가 높은 기물과 언제든지 맞교환 하라는 체스의 기본 이론에 얽매여서 그 뒤에 숨겨진 장기적인 전략을 읽지 못한 것이다. Deep Blue의 한 쪽 진영이 취약해진 틈을 타서 카스파로프의 폰들이 진출해서 40여수만에 매우 우세한 국면으로 만들었다. 이세돌 9단이 초반 사석 작전을 구사해서 압도적인 세력을 쌓으려고 할 때 알파고가 이에 대응할 수 있을지 궁금하다.

카스파로프가 첫 판을 쉽게 이겼음에도 왜 전체 시리즈에서는 패배했을까? 앞서 얘기한 대로 첫 판의 40여수 만에 카스파로프가 압도적으로 우세한 형세가 되었는데, 44수째 Deep Blue가 둔 수가 바로 문제였다. 나중에 밝혀진 바에 따르면 그것은 Deep Blue 프로그램의 버그 때문에 나온 것인데 형세에 아무 도움도 안 되는 수(소위 떡수)였다. 그 대신 체스의 고수라면 이 한 수라고 할만한 다른 유력한 수가 있었다. 그리고 바로 다음 45수째에 Deep Blue가 항복을 선언했다. 카스파로프는 이겼지만 Deep Blue의 44수가 도무지 이해가 안 되는 것이 매우 답답했다. 그래서 숙소로 돌아와 다른 일류 고수들과 함께, Deep Blue가 나오기 전까지 최고로 치던 Fritz라는 체스 컴퓨터까지 동원해서 이후 진행을 분석했다. 그 결과, 44수 대신 일견 유력해 보였던 수를 Deep Blue가 뒀다면 그로부터 20수 뒤에 카스파로프가 외통으로 이기는 길이 있다는 것을 발견했다. Deep Blue의 44수는 단지 버그 때문에 다음 착점을 찾지 못해 임의로 둔 것인데, 이를 카스파로프는 Deep Blue가 20수 뒤까지 내다볼 수 있어서 일견 유력해 보이는 수를 비튼 것이라고 오해했다.

2국에서는 Deep Blue가 백을 잡았다. 바둑 (baduk) 에서는 흑이 선착하는 어드밴티지를 덤을 부담시킴으로써 상쇄하지만, 체스 (chess) 에서는 덤 같은 것이 없어서 먼저 두는 백이 절대적으로 유리하다. 대신, 백을 번갈아 잡기 위해 항상 번기로 두고 점수(승 1점, 무 0.5점, 패 0점)로 승부를 가린다. 즉, 흑 입장에서는 상대가 비슷한 실력이면 대개 불리한 형세가 될 수 밖에 없지만, 그렇더라도 비길 수 있는 길을 찾는 것이 중요하다. 그런데 2국에서 카스파로프는 조금 불리한 형세가 되자 일찍 포기해버렸다. 카스파로프로는 총 6번기 중에서 1국을 이겼고 아직 네 번의 대국이 남았는데, 20수나 내다볼 수 있는 컴퓨터를 상대로 무리하지 말자는 생각이었다. 그런데 2국이 끝난 뒤에 흑이 어렵지 않게 비길 수 있는 길이 있었다는 것이 밝혀지자 카스파로프는 더욱 심리적으로 동요됐다. 3~5국을 어렵게 비긴 뒤 맞이한 6국에서 카스파로프는 초반에 간단한 수순을 착각해서 한 시간도 안돼서 항복했고, 전체 시리즈가 Deep Blue의 승리로 돌아갔다. 이세돌 9단이 경계할 만한 대목이다.

3월에 있을 대결을 예상해보면 나는 이세돌 9단이 특별한 작전 없이 그저 여느 인터넷 바둑 두듯이 임하면 5대 0으로 이길 것으로 본다. 한 가지 더 바란다면, 3대 0으로 시리즈 승리를 결정짓고 난 다음에 나머지 두 판 정도는, 앞서 얘기한 대로 초반을 완전히 새롭게 짜는 동시에 축머리를 활용한다는지 멋진 사석작전을 펼친다든지 해서 최신 인공 지능 알고리즘과 강력한 계산력에만 의존해서 바둑에 도전하는 것이 아직 분명한 한계가 있음을 보여주면 좋겠다.