본문 바로가기

Hi-Tech/인공지능

알파고 4승 1패 - 구글은 왜 이세돌 9단을 선택하였을까요?

반응형

인류와 컴퓨터(기계)의 대결로 세계적 관심을 받았던 세기의 대국은 결국 알파고의 4승 1패로 끝났습니다. 3월 15일 이세돌 9단은 구글딥마인드의 인공지능 알파고와 마지막 제5대국에서 280수 만에 아쉽게 패하였습니다. 이번 대국을 보면서 몇가지 궁금했던 점들을 정리해 보았습니다.

Q. 구글은 왜 이세돌 9단을 선택하였을까요?

A. 구글 딥마인드은 왜 이세돌9단에게 알파고와 세기의 대국을 치러자고 하였을까요? 현재 바둑의 세계 랭킹 1위는 중국의 커제 9단이고, 2위는 우리나라의 박정환 9단입니다. 3위는 일본의 이야마 유타 9단이고, 이세돌 9단은 세계 4위입니다. 이세돌 9단은 과거 10년간 세계 최고의 바둑기사로서 전설 같은 인물입니다. 이세돌 9단은 1995년 12세에 프로 바둑에 입단하여, 2000년 이후 국내 대회에서 30회, 세계 대회에서 18회의 우승을 하였습니다. 

구글 딥마인드는 이세돌 9단을 대국 상대로 요청한 것은 20대의 커제 나 박정환 9단보다 프로 경력이 21년이 되는 이세돌 9단의 대국 데이터가 많기 때문입니다. 이세돌 9단의 기보가 많아 알파고의 알고리즘틀 테스트하기에 좋았을 것입니다. 또한 이세돌 9단은 정석보다는 창조적인 수와 변칙 수를 활용하고 있어 알파고의 약점을 찾아내어 개선할 수 있는 기회를 알아내는데 도움이 된다고 생각한 것입니다. 즉 구글은 인공지능 알파고의 성능을 시험하고 약점을 보완하기 위해 이세돌 9단을 선택한 것입니다.


Q. 바둑 수의 경우의 수는 얼마나 되나요?

A. 바둑은 이 우주 전체의 원자 수보다 많은 10의 170제곱(10^^171)이나 되는 경우의 수가 있어 도저히 컴퓨터가 이기기 힘든 인간의 영역으로 꼽히고 있었습니다. 2016년 1월 20일에 19x19 바둑판에서 가능한 배치의 수가 완전히 계산되었습니다. 

http://tromp.github.io/go/legal19.html에 상세한 설명되어 있습니다.

208,1681,9938,1979,9846,9947,8633,3448,6277,0286,5224,5388,4530,5484,2563,9456,8209,2741,9612,7380,1537,8525,6484,5169,8519,6439,0725,9916,0156,2812,8546,0898,8831,4427,1297,1531,9317,5577,3662,0397,2470,6484,0935가지로, 대략 10의 171제곱의 수입니다.

 

Q. 알파고의 이전 대국은 어떻게 되었나요?

A. 구글 딥마인드는 2016년 1월 28일 국제 학술지 네이처에 최초로 프로 바둑 기사와의 대국에서 접바둑이 아닌 호선으로 승리한 컴퓨터 프로그램 알파고를  논문에 게재하여 공개하였습니다. 여기서 호선은 양측 실력이 같다는 가정 하에 같은 조건에서 진행되는 대국을 의미합니다. 이 논문에서 알파고는 바둑 유럽 챔피언인 중국의 프로 바둑기사 판 후이 2단을 5 대 0으로 이긴 사실을 함께 발표하면서 세간의 관심을 끌었습니다. 


Q. 알파고의 승리 비결과 알고리즘의 핵심은 무엇인가요?

A. 알파고는 바둑을 확률적 수학으로 계산하는 것이 불가능하여 무작위로 수을 대입하면서 예상 확률을 계산하여 가장 가능성이 높은 수를 선택하는 ‘몬테카를로 트리탐색을 알고리즘으로 만들어졌습니다. 구글 딥마인드는 여기에 정책망과 가치망 두 개의 신경망을 결합하였습니다. 정책망은 상대방의 다음 수를 미리 예측해 이길 가능성이 높은 수만 고려하는 것이고, 가치망은 바둑 돌의 위치 별로 누가 이길 것인지를 예측하는 것입니다. 구글 딥마인드는 정책망의 예측 성공률을 57%까지 높였습니다. 알파고는 이 두 신경망을 동시에 활용해 대국을 진행하면서 경험을 쌓아 스스로 학습하고 전략을 짜고있습니다.

데미스 하사비스 구글 딥마인드 최고경영자(CEO)는 알파고를 개발하면서 프로 바둑기사들의 대국 기보 3,000만건을 입력하였다고 말합니다. 그리고 나서 알파고는 입력된 기보를 바탕으로 쉬지 않고 바둑을 두며 학습하도록 하였습니다. 딥마인드의 연구총괄 데이비드 실버는 “이는 알파고가 1,000년에 해당하는 시간 만큼 바둑을 학습한 것과 같다"고 하였습니다.


Q. 앞으로 알파고는 어떻게 발전될까요?

하사비스 CEO는 제 4국이 끝난 뒤 기자회견에서 "이세돌 9단의 승리를 진심으로 축하합니다. 우리가 한국에서 이세돌 9단과 대국을 펼치는 이유는 알파고의 한계를 시험하기 위해서였습니다. 그래서 오늘의 패배는 알파고에 매우 소중합니다"라고 말하였습니다. 

구글 딥마인드의 데이비드 실버 리서치 담당 과학자도 “알파고는 프로토타입 단계(시제품보다 더 초기적인 단계)에 있는 프로그램으로, 아직 베타 단계(본격적인 상용화 전 단계)도 아니며, 심지어 알파 단계(첫 번째 테스트 단계)도 아닙니다. 알파고가 어떤 문제가 있는지, 단점이 있는지는 경기를 지속적으로 해야만 알아낼 수 있습니다. 그래서 이렇게 훌륭한 기량을 가진 분들이 그다지 많지 않습니다. 그렇기 때문에 알파고의 문제점과 단점을 파악하기 위해 이세돌 9단과 경기를 치르는 것입니다”이라고 말하였습니다. 제4국의 패배를 통하여 알파고 시스템은 개선하기 위한 추가 개발을 할 것이며, 이는 곧 미래 진보에 기여할 것으로 생각합니다. 

반응형