본문 바로가기

광고

광고닫기

광고

본문

광고

미래&과학 과학

알파고, 학습통해 예측력 키워…딥블루보다 ‘AI’에 근접

등록 2016-03-08 19:42수정 2016-03-09 12:10

이세돌-알파고 9일 ‘세기의 대결’

바둑의 수 10의 360제곱 ‘무한대’
초읽기 안에 계산 사실상 불가능

단점 극복위해 경우의 수 제한해
2개 알파고로 대국…강화학습도
온라인 바둑 프로 2~5단 추정

“전문기사 직관에 가깝다고 생각”
“기풍 등 추상적 개념 승화못해”
구글 에릭 슈밋 회장 공동취재사진
구글 에릭 슈밋 회장 공동취재사진
“인간이 컴퓨터에 졌다.” 1997년 5월13일 아이비엠(IBM)이 만든 컴퓨터 ‘딥블루’가 체스 세계챔피언인 가리 카스파로프를 상대로 승리를 거뒀을 때의 국내 한 신문 기사 제목이다.

2011년 2월16일 아이비엠이 개발한 컴퓨터 ‘왓슨’이 미국 인기 퀴즈쇼 ‘제퍼디’에 출전해 두 명의 챔피언을 물리치고 우승을 했을 때의 제목은 “퀴즈 달인들 슈퍼컴퓨터에 완패”였다. 지난해 10월 구글의 자회사 구글 딥마인드가 개발한 컴퓨터 ‘알파고’가 유럽 바둑 챔피언인 판후이를 상대로 겨룬 5판의 대국에서 모두 이긴 사실을 보도하는 기사에는 “인공지능 컴퓨터, 프로 바둑기사 이겼다”라는 제목이 달렸다.

9일 인간과 컴퓨터를 각각 대표하는 이세돌 9단 대 알파고의 대국은 승패를 넘어 알파고가 단순한 슈퍼컴퓨터에서 인간을 닮은 인공지능 컴퓨터로 진화했음을 보여줄 수 있을지에 관심이 모인다. 알파고는 딥블루, 왓슨과 다르며 ‘인공지능’이란 수식어가 붙을 자격이 있는 컴퓨터인가, 아니면 이세돌 9단에게 이겨도 “기쁘다”는 말 한마디 못하는 그저 단순한 초고속 컴퓨터일 뿐일까.

딥블루와 알파고는 어떤 수를 두면 무슨 일이 일어날지 다 계산해본다는 접근 방법에서는 근본적으로 같다. 그러나 계산해야 하는 경우의 수가 다르다. 19×19의 게임판에 번갈아 돌을 내려놓는 바둑의 변화무쌍함은 8×8의 게임판에 이미 놓여 있는 말을 규칙에 따라 움직이는 체스와는 비교가 되지 않는다.

딥블루는 체스 챔피언급들이 치른 70만여회의 대국 기록을 기억해 계산에 이용했지만, 바둑은 최소로 잡아도 우주의 원자수(10의 80제곱)보다 훨씬 많은 10의 360제곱의 경우의 수가 있어 계산이 불가능하다. 카스파로프는 딥블루로부터 뛰어난 지능과 창의성을 느꼈다고 고백했지만, 챔피언의 평정심을 흔든 딥블루의 회심의 한 수는 나중에 프로그램 오류로 밝혀졌다. 추형석 소프트웨어정책연구소 선임연구원은 “딥블루는 모든 경우의 수를 계산해 최적의 수를 찾는 방식이어서 엄밀하게 인공지능이라 볼 수 없다”고 말했다.

왓슨의 작동 방식은 딥블루와 다르다. 왓슨은 퀴즈를 풀기 위해 자연언어처리 알고리즘을 사용했다. 바둑이나 체스의 경우의 수처럼 짜여 있는 자료가 아닌 비정형화된 자료로부터 추상적인 개념과 개념 사이에 연결돼 있는 관계를 학습하는 능력을 갖췄다. 유신 한국과학기술원(카이스트) 전산학부 교수는 “왓슨의 지능도 퀴즈쇼에 맞춰 최적화된 것이어서 완벽한 인공지능과는 거리가 멀다. 기존에 알려진 자연언어처리 알고리즘 수백개를 동시에 실행시켜 사람이 버저를 누르기 전에 먼저 그 결과를 취합해 정답을 찾는 능력을 지녔을 뿐이다”라고 말했다.

바둑 프로그램인 알파고가 정해진 시간 안에 모든 수를 검토해보기는 불가능하다. 무한대에 가까운 검토 범위를 중요한 수로 스스로 제한하면서 어떤 수를 두면 유리한지 불리한지 계산해야 한다. 알파고 제작진은 온라인 바둑 서버에서 수집한 바둑 고수들의 기보 16만개와 ‘몬테카를로 트리 검색’이라는 도구로 알파고에 이런 능력을 부여했다. 사람이라면 평생 공부해도 못할 양을 알파고는 5주 만에 돌파했다.

여기에 알파고는 바둑을 이기는 함수를 찾아내는 ‘심화학습’, 곧 딥러닝을 통해 바둑 고수들이 어디에 돌을 놓을 확률이 높은지를 예측하는 능력을 키웠다. 딥러닝은 3주 동안 3억4천만번 실행됐다. 딥마인드는 또 알파고 1과 알파고 2를 만들어 128차례의 자체 대결을 벌여 스스로 능력을 키우는 ‘강화학습’도 진행했다. 이 과정은 하루밖에 걸리지 않았다. 이후 알파고는 기존 바둑 프로그램 5개와 495번의 경기를 벌여 494번 승리했다.

현재 알파고의 성능은 온라인 바둑 서버에서 매기는 기준으로 프로 2~5단에 해당하는 것으로 추정된다. 알파고의 ‘엘로 레이팅’(승률 점수)은 판후이를 이겼을 당시 3140점이었다. 이세돌 9단이 3500점으로 조금 앞선다. 대국 당시 판후이는 알파고에 230점 뒤졌다.

추형석 연구원은 “알파고는 스스로 강화학습을 통해 전략을 한 단계 발전시켜 탐색할 폭을 줄였다는 점에서 전문기사의 직관에 가까워졌다고 볼 수 있다”고 말했다. 김문상 한국과학기술연구원(키스트) 지능로봇사업단장은 “이세돌과 알파고의 대결은 인공지능 로봇 분야에서 큰 획을 긋는 사건이다. 로봇이 인간을 본떠 스스로 학습을 할 수 있다는 단초를 제공했다는 의미가 있다”고 말했다.

하지만 알파고가 ‘갑자기 새로운 사고 능력을 가지게 됐다’고 해석하는 것은 무리라는 경계의 목소리도 나온다. 유신 교수는 “어떤 한 수밖에 정답이 없는 뻔한 경우에도 알파고는 중요한 수들을 추려낸 뒤 각 수들의 유불리를 미리 고려해보는 과정을 거치지 않고는 한 수도 둘 수 없다. 바둑을 두는 기풍이나 남을 가르치는 바둑이론 등 추상적인 개념으로까지 승화시키지는 못한다”고 말했다. 김 단장도 “컴퓨터의 지능이 인간과 비슷해지려면 몇십년은 걸릴 것이다. 창조적, 감성적인 분야에서 로봇이 과연 인간을 뛰어넘을 수 있을지는 미지수다”라고 말했다.

이근영 선임기자 kylee@hani.co.kr


항상 시민과 함께하겠습니다. 한겨레 구독신청 하기
언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

광고

광고

광고

미래&과학 많이 보는 기사

과학자들은 외계인의 존재를 얼마나 믿을까? 1.

과학자들은 외계인의 존재를 얼마나 믿을까?

영양 가득 ‘이븐’하게…과학이 찾아낸 제4의 ‘달걀 삶는 법’ 2.

영양 가득 ‘이븐’하게…과학이 찾아낸 제4의 ‘달걀 삶는 법’

온 우주 102개 색깔로 ‘3차원 지도’ 만든다…외계생명체 규명 기대 3.

온 우주 102개 색깔로 ‘3차원 지도’ 만든다…외계생명체 규명 기대

2032년 소행성 충돌 위험 2.2%로 상승…지구 방위 논의 시작되나 4.

2032년 소행성 충돌 위험 2.2%로 상승…지구 방위 논의 시작되나

시금치·양파·고추…흰머리 덜 나게 해주는 루테올린의 발견 5.

시금치·양파·고추…흰머리 덜 나게 해주는 루테올린의 발견

한겨레와 친구하기

1/ 2/ 3


서비스 전체보기

전체
정치
사회
전국
경제
국제
문화
스포츠
미래과학
애니멀피플
기후변화&
휴심정
오피니언
만화 | ESC | 한겨레S | 연재 | 이슈 | 함께하는교육 | HERI 이슈 | 서울&
포토
한겨레TV
뉴스서비스
매거진

맨위로
뉴스레터, 올해 가장 잘한 일 구독신청