[한겨레 미래&과학]
28일 프로선수팀과 ‘도타2’ 대결
바둑·포커 평정 이어 새 도전
‘1 대 1’ 아닌 ‘5 대 5’ 팀플레이
팀내 협업 능력이 승패를 좌우
준프로급과 경기선 이미 승리
매일 180년치 게임하며 연습중
28일 프로선수팀과 ‘도타2’ 대결
바둑·포커 평정 이어 새 도전
‘1 대 1’ 아닌 ‘5 대 5’ 팀플레이
팀내 협업 능력이 승패를 좌우
준프로급과 경기선 이미 승리
매일 180년치 게임하며 연습중
인기 온라인 게임 도타(Dota)2에서 인간팀을 상대로 첫 승리를 거둔 인공지능 ’파이브(Five)’의 게임 내 모습. 오픈에이아이(OpenAI) 제공
지난달 25일 인공지능 도타2 팀 ’파이브’를 상대로 대결을 펼치고 있는 오픈에이아이(AI) 회사 내 최강 고수팀의 모습. 오픈에이아이(OpenAI) 제공
인공지능 기술은 어떻게 2년 만에 또다시 이런 괄목할만한 발전을 눈앞에 두게 되었을까? 알고리즘이 스스로 원리를 익히는 강화학습(reinforcement learning)의 예상을 초월한 잠재력이 원인으로 꼽힌다. 강화학습이란 기본적인 규칙만 알려주고 인공지능이 약간씩 변형한 자신의 다양한 버전과 계속해 싸우면서 스스로 익히는 기계학습의 방식을 말한다. 오픈에이아이는 팀전 승리 뒤 “이번 결과는 우리가 강화학습 알고리즘의 잠재력에 대한 믿음이 부족했다는 것을 의미한다”고 설명했다. 충분한 연산력과 적절한 설계만 있으면 강화학습으로 팀워크와 같은 이타적인 행동까지 익힐 수 있다는 이야기다. 중앙연산장치(CPU) 코어 12만8천개를 단 파이브 인공지능은 매일 180년 치의 게임 플레이를 해치우면서 모든 전략을 스스로 개발했다. 알파고가 인간의 기보를 우선 학습했던 것과 달리 파이브의 행동은 모두 스스로 깨우친 것이다. 이런 강화학습 방식으로 만들어진 알파고의 후속 버전 ‘알파고제로’(AlphagoZero) 역시 3일을 혼자 훈련해서 알파고를 100대 0으로 이긴 바 있다. 다음 달이면 이스포츠의 왕좌마저 기계에 내주는 모습을 지켜봐야만 할까. 아직 승부를 점치기는 이르다는 반론도 있다. 파이브의 경기 내용을 들여다보면 인공지능의 강점뿐 아니라 한계도 엿보인다. 도타2에서 플레이어는 100종류가 넘는 영웅 가운데 하나를 골라 경기를 시작하게 되는데 파이브는 이 가운데 오직 5종류의 영웅으로만 학습하고 경기를 치렀으며, 상대방 인간팀도 이 5종류로만 경기하도록 규칙에 제한이 있었다. 아무리 놀라운 학습량을 자랑해도 짜인 틀 안에선 놀라운 능력을 보여주지만 틀 밖으로 벗어나면 구실을 할 수 없는 현 인공지능의 한계를 파이브도 여전히 안고 있는 셈이다. 이 때문에 인도의 기술 매체 <더 와이어>는 익명의 플레이어를 인용해 인간 최고수가 제트스키를 탄다면 파이브는 “아직 보조 바퀴가 달린 자전거를 타는 수준”이라고 평가한 바 있다. 오픈에이아이는 2018 도타2 인터내셔널에 앞서 오는 28일 프로 수준의 인간팀과 경기를 펼칠 계획이라고 밝혔다. 알파고부터 계속해서 예상을 넘어서는 능력을 보여왔던 인공지능의 행진이 과연 어디까지 이어질지 관심이 쏠린다. 권오성 기자 sage5th@hani.co.kr#AI bots just beat humans at the video game Dota 2. That’s a big deal, because their victory required teamwork and collaboration ? a huge milestone in advancing artificial intelligence. https://t.co/UqIUhh9xFc— Bill Gates (@BillGates) 2018년 6월 26일
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기