왼쪽은 인공지능 댁틸(Dactyl)이 실제 움직인 로봇 팔과 그에 딸린 카메라 장치의 모습. 오른쪽은 댁틸이 사이버 공간에서 스스로 학습하는데 쓰인 가상의 로봇 팔 모습이다. 오픈에이아이(OpenAI) 제공
비영리 회사 오픈에이아이(OpenAI)가 인간의 행동 데이터 없이 복잡한 손동작을 흉내 내는 인공지능을 개발했다고 30일(미국 현지시각) 밝혔다.
인간의 손은 극도로 정교한 도구다. 식탁 위의 컵을 잡는 단순한 동작도 기계로 재현하려면 극도로 복잡한 계산이 필요하다. 지금도 수많은 공장에 로봇 팔들이 고속으로 움직이고 있지만 이들은 규격화된 물건을 잡는 짜인 프로그래밍을 수행할 뿐이다. 즉 볼트면 볼트, 너트면 너트만 잡을 수 있을 뿐이지 주어진 조건 외의 물건에는 전혀 무용지물이라는 뜻이다. 사람처럼 무엇이나 쉽게 잡을 수 있는 로봇을 만드는 일은 아직도 매우 어려운 일이다.
테슬라의 창업자 일론 머스크가 후원하는 오픈에이아이는 이런 변하는 조건에도 사람의 손처럼 적응해서 로봇 손을 움직이는 새로운 인공지능을 개발했다고 밝혔다. 이 프로그램은 ’댁틸’(Dactyl)이라고 불린다.
댁틸의 놀라운 점은 사람의 행동 데이터를 전혀 학습하지 않고 이를 달성했다는 점이다. 지금까지 대부분의 인공지능은 인간의 데이터를 학습해서 제구실을 했다. 이세돌 선수와 싸운 알파고가 사람의 바둑 기보를 학습했듯이 말이다. 연구진은 사람의 데이터 대신에 인공지능이 스스로 다양한 시도를 가상으로 해보고 이를 실제에 적용해서 배우는 방식을 택했다. ‘시도-수정’의 반복 과정으로 스스로 깨우치도록 한 것이다.
댁틸에겐 자신의 로봇 팔과 목표 대상을 보는 세 방향 카메라의 화상 데이터만 주어졌다. 댁틸은 이를 바탕으로 실제 로봇팔을 움직이기 전 몇 초 동안 디지털 공간의 가상 삼차원 공간에서 물건을 다양한 방법으로 잡는 방법을 1천번가량 스스로 해보게 설계됐다. 그리고 최선이라고 생각한 방법을 실행에 옮긴다. 이후 실제 성공했는지 실패했는지의 데이터를 바탕으로 다음 시도 전에 같은 과정을 반복해 결국 최적의 움직임을 찾아내는 것이다.
이런 연산을 하기에는 아직 상당한 컴퓨터 자원이 필요하다. 연구진은 발표한 논문을 통해 6144개의 중앙처리장치(CPU)와 8개의 그래픽처리장치(GPU)가 필요했다고 밝혔다. 연구진은 이를 “50시간 동안 약 100년 치의 학습이 가능한 연산 능력”이라고 설명했다.
이를 통해 댁틸은 기존의 기계가 흉내 내기 어려웠던 복잡한 동작도 해낼 수 있는 것으로 나타났다. 예를 들어 우리가 상한 곳이 없는지 보기 위해 한 손으로 사과를 돌리듯이 훈련용 큐브를 떨어뜨리지 않고 돌리는 고난도의 동작도 스스로 익힌 것이다. 미국 카네기멜론 대학교 로봇 연구소의 스므루티 아마리요티(Smruti Amarjyoti) 연구원은 온라인 매체 <더버지>와 인터뷰에서 로봇의 움직임이 “지금까지 불가능하리라고 생각한” 수준이며 “우아하다”고 평했다. 반면 이탈리아기술연구원의 안토니오 비치(Antonio Bicchi) 교수는 인공지능이 “아직 (적당한 크기의 큐브를 돌리는 정도의) 정해진 조건에서 벗어나는 행동을 익혔다고 보긴 어렵다”고 말했다.
해당 논문 링크
권오성 기자
sage5th@hani.co.kr