포커페이스란 말이 있다. 도무지 상대방의 속을 알 수 없을 때를 일컫는 말이다. 포커가 불확실한 정보 조건 아래서 진행되는 게임이란 점에 빗대어 나온 비유어다. 논리적 연산망으로 짜인 컴퓨터로선, 정보의 빈 구석이 많아 그만큼 뛰어들기가 어려운 게임이다. 실제로 그동안 컴퓨터는 번번이 포커판에서 인간에게 고배를 마셨다. 그런데 지난해 바둑 최고수를 이겨 세계를 놀라게 했던 인공지능이 새해 들어 또 일을 내고야 말았다.
‘두뇌와 인공지능의 포커 대결’에 참가한 선수들과 개발진 투오머스 샌드홀름(가운데). 리버스카지노
인공지능(AI)이 도박게임인 포커에서도 인간 최고수를 물리쳤다. 서양장기 체스(1997), 퀴즈쇼(2009), 바둑(2016)에 이어 또 하나의 대기록을 세웠다. 이번 대결은 특히 계산이나 학습 능력의 대결장이었던 지난 3번의 대결과 달리, 인간 고유의 영역이라 할 직관, 감정 등의 심리적 요인까지 개입된 대결이어서 더욱 놀라운 일로 평가된다.
미 카네기멜론공대가 개발한 인공지능 ‘리브라투스’는 1월 11일부터 30일까지 20일 동안 펜실베이니아주 피츠버그에서 열린 포커대회에서 한국계 미국인을 포함한 세계 최고의 포커 선수 4명을 모두 물리쳤다. 인공지능이 이들과 벌인 게임 횟수는 12만판에 이른다.
이번 대회에선 인공지능과 인간 선수에게 각각 카드를 2장씩 주고 테이블 위의 공용카드 5장과 합쳐 카드를 조합해 칩 내기를 벌이게 했다. 경기 규칙 방식은 ‘무제한 텍사스 홀뎀’을 적용했다. 참가자는 게임 중 카드의 일부만 알 수 있고 블러핑을 비롯한 다양한 전략을 이용해 상대방을 속일 수 있다. 리브라투스 개발자인 투오머스 샌드홀름 교수에 따르면, 이 게임에서 이뤄질 수 있는 카드 조합의 수는 10의 160제곱으로, 우주의 모든 원자 수를 합친 것보다 많다고 한다. 이번 대회에서 인공지능이 획득한 칩은 돈으로 따져 176만6250달러(약 20억원)였다.
이번 대회에 참가한 포커 선수 중 한 명인 대니얼 맥컬리. 카네기멜론대
이세돌과의 바둑 대결에서 이긴 구글의 알파고가 스스로 경기를 학습해 실력을 쌓는 딥러닝 방식을 이용한 반면, 리브라투스는 게임을 거듭하면서 쌓이는 통계를 토대로 상대방 선수의 독특한 게임 습관 등을 파악해 과감한 베팅 전략을 구사했다. 예컨대 상대의 특성을 파악해 패가 나쁜데도 높은 금액을 베팅하는 블러핑 기술까지 보여줬다. 이에 따라 리브라투스는 회를 거듭할수록 승률이 높아졌다. 샌드홀름 교수는 “불완전한 정보로 전략을 짜고 추론을 하는 인공지능의 능력이 인간 최고수보다 월등해졌다”며 “이는 인공지능에서 기념비적인 성과”라고 말했다. 그는 오는 4~9일 샌프란시스코에서 열리는 첨단인공지능협회 회의에서 구체적인 리브라투스의 전략과 성공 비밀을 공개할 예정이다.
앞서 2015년에 비슷한 대결이 펼쳐졌지만 이 때는 인간이 이겼다. 이번 대회에서도 애초 리브라투스의 승리 가능성을 높게 보는 사람은 많지 않았다. 포커는 체스나 바둑과 달리 직관, 속임수 등 인간 고유의 특성들이 영향을 끼치기 때문이다. 그러나 리브라투스는 경기초반부터 이런 예상을 무색하게 만들었다.
전문가들은 리브라투스와 같은 인공지능이 가격협상이나 군사 전략 결정, 사이버 보안, 경매 등 실제 사회에서 의사결정을 할 때 적절히 활용할 수 있을 것으로 기대하고 있다. 그러나 이런 류의 인공지능은 인류에겐 양날의 칼이다. 현실 세계의 불확실하고 불리한 상황을 해소하는 이로운 해결사가 될 수도 있지만, 인공지능이 인간을 상대로 속임수를 쓸 수 있다는 점에선 예측불허의 위협적 존재로 변모할 수도 있다.
곽노필 선임기자
nopil@hani.co.kr
▶
곽노필의 미래창