게임하는 인공지능
알파고가 세상을 깜짝 놀라게 하기 전인 2015년, 구글 딥마인드의 연구진은 ‘벽돌깨기’나 ‘스페이스 인베이더’ 같은 추억의 게임들을 이용해 인공지능을 훈련시키고 있었다. 이 인공지능들은 게임에 대한 아무런 설명도 듣지 못한 채 게임을 시작해 4시간 만에 최고수급에 오르며 가능성을 보여줬다. 인간의 유희인 게임은 인공지능 최고의 훈련장이다. 최고 인기 게임 ‘스타크래프트’에서 기자가 인공지능과 한판 승부를 벌였다.
4 대 1. 의도한 바는 아니었다. 알파고 대 이세돌과 같은 결과가 나올 줄이야. 사실 솔직한 심정은 기록보다 ‘1승이라도 따낸 게 다행이다’이다. 그만큼 인공지능의 벽은 높았다. 바로 기자 대 인공지능의 ‘스타크래프트’(스타) 대결 이야기다. 이는 과거부터 지금까지 벌어지고 있는 인간과 기계의 숱한 대결 가운데 하나였고, 이런 대결들이 품고 있는 공통된 의미를 던진 일이기도 했다.
일은 심심하게 시작됐다. 회사 팀장의 “야, 구글이 바둑 다음으로 스타를 지목했는데 스타 인공지능이랑 한번 싸워 보면 어떻겠냐”는 장난 섞인 말이 발단이 되었다. 알아보니 스타크래프트 인공지능들이 서로 겨루는 ‘2대 세계 대회’가 이미 있었고, 그 가운데
한 곳의 주관을 우리나라
세종대 컴퓨터공학과 인지지능연구실(CILab)에서 맡고 있었다. 연구실을 이끄는 김경중 교수에게 연락을 했다. 김 교수는 흔쾌히 대결을 주선했다. 그렇게 우리의 첫 시합은 지난 5월26일에 이뤄졌다.
상대는
티에스시무(TSCMOO)라는 인공지능. 지난해 세계 최대 스타크래프트 인공지능 대회인
‘에이드’(AIIDE)에서 우승한 최강자로, 베가르 멜라라는 독립개발자가 만들었다. 에이드는 주최 쪽인 ‘인터랙티브 디지털 놀이를 위한 인공지능 협회’에서 이름을 땄는데, 캐나다 앨버타대학 주관으로 올해 6회째를 맞는다. 대결은 이세돌 9단 대 알파고를 흉내내 승패 상관없는 5전을 하기로 했다.
스타의 기본적인 규칙은 이렇다. 우주를 배경으로 이 게임에는 테란, 프로토스, 저그라는 세 종족이 등장한다. 테란은 인간, 프로토스는 발달된 외계인, 저그는 영화 <에일리언>에 나오는 괴생명체라고 생각하면 쉽다. 각 종족은 이런 특징에 맞는 게임 스타일이 있다. 플레이어는 지휘관이 되어 이들 가운데 하나를 택해 병력을 생산하고 상대방을 공격해 전멸시키는 것이 목표다. 스타는 1990년대 말 국내 피시방의 부흥기와 궤를 같이하면서, 우리나라를 이스포츠(e-sports)의 세계 최강국으로 등극시킨, 명실상부 사상 최고 인기의 컴퓨터게임이라 할 수 있다. 그만큼 많은 부모들의 속을 썩인 ‘웬수’이기도 하다.
인공지능보다 인간이 무섭더라
나 역시 그런 아들 중에 하나였다. 고등학교 3학년쯤부터 불기 시작했던 스타의 광풍은 우리 또래들을 사로잡았다. 피시방이 대학가에서 당구장과 자웅을 겨뤘고, 시험 때면 친구 자취방에 모여 스타 프로리그 생중계를 보며 건성으로 공부를 했다. 당시 나는 그런 친구들 사이에서 ‘스타 좀 하는 놈’으로 꼽혔다. 대결 날짜가 잡히자 나는 퇴역 파일럿이 비행복을 꺼내 입는 심정으로 컴퓨터에 15년 만에 스타를 깔았다. 게임에 내장된 자체 인공지능을 상대로 몇 판 하면서 몸을 풀었다.
그런데 문득 대결 날짜가 다가오자 긴장하고 있는 자신을 발견했다. ‘고작 컴퓨터게임인데 왜 이러지.’ 스멀스멀 피어오르던 두려움의 실체는 대결 당일 명확한 모습을 드러냈다. 대결 장소인 세종대 다산관 연구실에 도착하자 대결 운영을 맡은 배청목 연구원을 비롯한 세 명의 사람들이 있었다. 긴장감의 실체는 이것이었다. 대결의 상대인 인공지능이 아니라 대결을 지켜볼 주변의 인간들 말이다.
지난 1월 알파고와 바둑 대결을 수락할 당시 이세돌 9단은 자신감이 넘쳤다. 그는 “이길 것이라고 자신한다”고 말했다. 알파고는 구글이라는 최고 기술을 갖춘 거대한 조직의 후원을 받아 탄생한 프로그램이지만 근본적으로 ‘컴퓨터 바둑게임’임은 틀림없다. 하지만 이 컴퓨터게임을 할 날짜가 다가올 때 이 9단이 느낀 압박감은 어땠을까. 고작, 대결에 큰 관심을 두지 않는 연구원들 앞에서 스타를 하는 나조차 ‘같은 인간이 보고 있다’는 사실에 ‘쪽 팔리면 안 된다’는 큰 부담을 느꼈다. 세기의 대결로 불리며 전세계 사람들이 생중계로 꼼짝 않고 바라보는 가운데 게임을 하는 부담감이란 상상조차 어렵다. 이 9단 최대의 적은 알파고가 아니라 인간이 아니었을까.
지난달 2일 세종대 인지지능연구실에서 권오성 기자와 스타크래프트 인공지능 티에스시무(TSCMOO)가 대결을 펼치고 있다.
인공지능 ‘티에스시무’는 저그, 기자는 프로토스를 택했다. 경기는 10분도 채 안 돼 싱겁게 끝났다. 처참한 패배였다. 나는 연구원들을 흘끔 봤다가 “장난 아니네요”라고 혼잣말을 애매하게 중얼거리며 뒷머리를 긁을 수밖에 없었다.
실력도 녹슬었지만 상대를 얕잡아 본 데에도 패배의 이유가 있었다. 사전 취재 결과, 스타의 인공지능은 수준이 아직 높지 않다고 판단했기 때문이다. 연구자에 따라 조금씩 다르지만, 인공지능의 대체적인 정의는 ‘주어진 환경에 대해 사람과 같이 (또는 합리적으로) 추론하고 행동하는 기계’라 할 수 있다. 이를 구현하는 방법에는 여럿이 있을 수 있다.
1970~80년대 연구자들은 주어진 상황에 대해 ‘~라면, ~한다’는 조건 반응형의 프로그램을 활발하게 개발했다. 이들은 전문 분야별로 이런 식의 프로그램을 정교하게 짠다면 사람 같은 구실을 하는 기계를 만들 수 있으리라 보았다. 이를 ‘전문가 시스템’이라 한다.
1990년대부터 다른 방식이 활발히 연구되기 시작했는데, 상황에 대해 기계가 직접 패턴을 익혀서 깨치게 만드는 방식이다. 이를 ‘기계학습’(머신러닝)이라고 한다. 전문가 시스템과 기계학습의 대표적인 예가 각각
‘딥 블루’와
‘알파고’다. 딥 블루는 1997년 체스 챔피언 가리 카스파로프를 꺾은 아이비엠(IBM)의 인공지능 컴퓨터다. 체스와 바둑 최강자에 올랐다는 점을 놓고 보면 둘이 선후배처럼 보이지만, 사실 전혀 다른 녀석들이다. 딥 블루는 정해진 알고리즘에 따라 현재 체스판에서 게임 종료까지 가능한 수를 최대한 빠르게 계산한 뒤 두는 ‘전문가 시스템’이지만, 알파고는 기존의 기보 데이터들을 학습해서 어떻게 둘지를 스스로 정하는 ‘머신러닝’ 시스템이다.
현재 스타의 인공지능들은 모두 전문가 시스템이다. 김경중 교수는 “머신러닝은 우리 연구실을 비롯해 미국, 캐나다 등에서도 적용을 시도하는 중”이라고 말했다. 즉, 아직 스타 인공지능은 정해진 규칙에 따라서 움직인다는 말이다. 내가 변칙적인 움직임을 보이면 기계가 착오를 일으키는 ‘구멍’이 분명히 있으리라 보았다.
머신러닝을 적용한 스타 인공지능이 아직 없는 데는, 구글처럼 큰 기업이 아직 큰 관심을 보이지 않은 때문도 있겠지만, 학습시키기에 너무 복잡하다는 점도 작용했다. 공부를 시키려면 교재가 되는 데이터가 있어야 한다. 알파고는 기존 기보 16만개를 전산화해서 교재로 삼았다. 스타도 데이터가 될 ‘리플레이 파일’(게임을 기록한 파일)은 많다. 하지만 이를 학습용 데이터로 전환하기가 무척 어렵다. 바둑은 19×19 바둑판에 번갈아서 두는 바둑돌의 숫자라고 해봐야 한 게임의 정보량이 그렇게 많지 않다. 하지만 스타는 전장이 수천만개의 픽셀(화면의 화소수)로 구성됐고 상황이 실시간으로 변하기 때문에 정보량이 어마어마하다. 세종대 연구실의 김만제 연구원은 “이 방대한 데이터를 어떻게 처리할지가 어려운 문제”라고 말했다.
구글 딥마인드, 다음 목표 ‘스타’
정보 장악, 실시간 판단 어려워
단기간에 인간 이기기 힘들 것
전직 프로게임단 소속 홍인석씨 대결
초반 멈칫했지만 6개 AI 상대 전승
‘머신러닝’으로 판도 바뀔지 관심
‘알파크래프트’의 약점
이를 해결한다 해도, 스타라는 게임은 인공지능 개발자로서 풀기 힘든 두 가지의 큰 난제를 안고 있다. 구글의 수석 연구위원 제프 딘이 알파고 경기 때 한국에서
다음 목표 가운데 “스타”를 언급한 이유도, ‘스타 정복’은 ‘바둑 정복’ 못지않은 큰 도전이기 때문이다.
불완전 정보 게임: 바둑은 두 선수가 바둑판을 모두 보며 진행하는 완전 정보 게임이다. 하지만 포커와 같이 상대의 패를 볼 수 없는 불완전 정보 게임에선 상대 수를 추측해야 하는데 인공지능에겐 매우 어려운 일이다. 사진출처 위키미디어
첫째, 스타는 ‘불완전 정보 게임’이다. ‘알파고의 아버지’, 구글 딥마인드의 데미스 허사비스 최고경영자(CEO)는 이세돌과 두번째 대결날 기술전문매체
<더 버지>와의 인터뷰에서 “완전 정보 게임의 정점은 바둑이다. 하지만 포커와 같은 불완정 정보 게임은 (인공지능이 정복하기) 매우 어렵다”고 말했다. 불완전 정보 게임이란 게임의 모든 정보가 게이머에게 모두 공개되지 않는 게임이다. 바둑과 같이 복잡한 게임도 정복했는데, 포커같이 단순한 게임이 어렵다고 하는 이유는, 상대의 패를 볼 수 없을 경우 컴퓨터가 데이터를 학습해서 승리를 위한 대응 방법을 알아내기가 매우 어렵기 때문이다. 스타도 상대가 무엇을 하는지 정찰을 하지 않으면 알 수 없다.
실시간 판단: 바둑은 수를 둘 때마다 1분 이상씩 게산할 시간이 주어진다. 하지만 스타크래프트 같은 게임에서는 이런 시간 없이 순간순간 판단을 내려야 한다. 그만큼 연산량이 엄청나게 늘어나기 때문에 인공지능에 불리하다. 사진은 게임 인공지능의 실시간 판단을 실험하기 위한 대전액션게임. 사진출처 IEEE CIG
둘째, ‘실시간’이다. 바둑은 상대와 내가 번갈아 둔다. 이 9단이 두고 나면 알파고는 1분 이상 열심히 전세계에 분산된 클라우드 컴퓨터를 돌릴 시간이 있었다. 하지만 스타는 실시간으로 진행되는 게임이다. 순간 최적의 판단을 내리기 위해 1분 동안 슈퍼컴퓨터를 돌리고 있을 여유 따위는 없는 것이다. 인간의 뇌는 화면을 잠깐 슥 보면 바로 처리할 수 있지만 말이다. 스타는 이런 특징을 동시에 지녔기에 인공지능한테 큰 도전이다.
하지만 이런 우위 속에서도 나는 졌다. 이유는 인공지능의 전투 능력이 상상을 초월했기 때문이다. 스타에서 움직임은 분당 활동수(APM·action per minute)로 측정한다. 게이머가 1분 동안 얼마나 많은 명령을 내리느냐 하는 수치다. 전성기 프로게이머가 400~500 정도 된다. 그런데 인공지능의 경우 이 수치가 높을 때는 1만이 넘는다. 최고수의 50배다. 이 때문에 부대와 부대가 맞붙는 전투에서는 도저히 컴퓨터를 당해낼 재간이 없는 것이다. 요컨대 아직 스타 인공지능은 전략에서 약하고 전투에서 강하다. 이를 명심한 나는 지난달 2일 추가 2패 끝에 드디어 1승을 거머쥘 수 있었다. 40분 가까이 되는 장기전에서 인공지능이 전략적인 실수를 범한 덕분이었다.
프로게이머도 나서다
티에스시무 외에도 스타 인공지능은 여럿이다. 에이드를 주최하는 앨버타대학의 ‘앨버타봇’을 비롯해, 일본 리쓰메이칸대의 ‘아이스봇’, 개인 개발자의 ‘스카이넷’ 등이 대표적이다. 이들의 수준은 어느 정도 될까?
스타크래프트 프로게이머 연습생 출신인 홍인석(26, 숭실대 학생)씨가 15일 오후 서울 광진구 군자동 세종대학교 다산관에서 인공지능과 스타크래프트 대결을 하고 있다. 김명진 기자 littleprince@hani.co.kr
지난달 15일 전직 프로게임단 소속 선수였던 홍인석씨와 이들의 대전도 진행해보았다. 최상위 6개 인공지능들과 단판 승부로 진행된 이날 대결에서 결과는 홍씨의 전승으로 끝났다. 홍씨는 “티에스시무와 스카이넷, 두 개 정도는 순간 사람이 아닌가 깜짝 놀라기도 했다. 하지만 전체적으로 실력이 좋다고 하긴 어렵다”고 말했다. ‘알파크래프트’의 등장까지는 아직 먼 셈이다. 김 교수는 “정확한 예측은 어렵지만 앞으로 몇년은 더 걸릴 것”이라고 말했다.
게임과 인공지능은 떼려야 뗄 수 없는 역사를 공유하고 있다. 알파고를 만든 허사비스만 해도 원래 16살 때부터 게임을 개발하기 시작한 게임광이었다. 그가 인공지능에 관심을 가진 계기 중에 하나도 게임 속에 등장하는 인물들의 인공지능을 더 그럴싸하게 발전시키고자 했기 때문이다. 체스를 비롯해 체커, 장기, 오셀로 등 각종 게임에서 인간을 능가하는 무언가를 만들어보고자 하는 욕구는 많은 인공지능 개발자들의 열정을 자극했다. 2000년대부터 이런 욕구는 컴퓨터게임으로 옮아가 현재 활발한 연구가 진행 중이라고 한다. 게임회사들도 인공지능 개발에 관심이 많고 활발한 투자를 벌이는 편이다.
이런 연구들의 끝은 어디일까? 알파고에 연패하는 이세돌을 보며 많은 이들은 무력감과 우울증을 호소하기도 했다. 게임 종목들에서 차례차례 지구 최강의 타이틀을 인간이 인공지능에 내주는 모습들은, 현실에서 일자리를 기계에 내주는 모습의 전주곡처럼 많은 이들을 불안에 떨게 하기도 한다. ‘알파크래프트’ 앞에 전직 프로게이머 이영호나 홍진호가 무릎 꿇는 모습을 보는 것은 나 같은 ‘스타 키드’에게는 비참한 일이다.
하지만 미래는 관점에 따라 다르게 다가온다. 체스 최강자의 타이틀을 딥 블루에 내준 뒤 체스계에서는 흥미로운 현상이 벌어졌다. 인간과 기계가 짝을 지어서 출전할 수 있는 ‘프리스타일 체스’(또는 발전된 체스)라는 분야가 새롭게 열린 것이다. 인간 뇌와 기계가 협업하는 기존의 수준을 뛰어넘는 새로운 세계가 열린 셈이다. 인공지능 평가에 참여한 홍인석씨는 이번 대결에 참가한 뒤 소감을 묻는 질문에 이런 말을 했다. “요즘 취업 준비도 잘 안되고 의욕이 없었는데 간만에 대결 준비를 하면서 활기를 느꼈어요. 도전할 대상을 만나 즐거웠습니다.” 게임은 미지의 상대를 만났을 때 재미있는 법이다.
권오성 기자
sage5th@hani.co.kr
※ 기자의 착오로 프로게이머의 전성기 때 분당활동수를 200 정도 된다고 썼는데 이를 400~500으로 바로잡았습니다.