왼쪽부터 아마존 에코, 구글 홈, 애플 홈팟.
인공지능 기술에 기반한 음성비서 기능을 탑재한 스피커, 이른바 스마트 스피커 시장이 놀라운 성장세를 보이고 있다. 마치 날개를 단 듯하다.
전 세계 인공지능 스피커 보급 대수가 지난해 말 1억대를 돌파한 데 이어 올해 말에는 2억대를 넘어설 것이라는 전망이 잇따라 나오고 있다. 2014년 11월 아마존이 알렉사라는 음성인식 인공지능을 탑재한 스마트 스피커 `에코'를 출시한 지 불과 4~5년만의 대기록이다. 가파른 성장세는 당분간 계속돼 인공지능 스피커 시장이 2021년엔 태블릿 시장을 뛰어넘을 것으로 전망됐다.
IT시장 조사업체 캐널리스(Canalys)가 15일(현지시간) 발표한 분석보고서에 따르면 전 세계 인공지능 보급 대수는 지난해 말 현재 1억1400만대로 처음으로 1억대를 돌파했다. 보고서는 올해도 인공지능 스피커에 대한 인기가 이어지면서 연말에는 82.4% 늘어난 2억790만대에 이를 것으로 예상했다. 앞서 국제컨설팅업체 딜로이트는 전 세계 인공지능 스피커의 보급대수가 올해말까지 2억5천만대에 이를 것이라는 보고서를 지난해말 냈다. 시장 규모는 70억달러로 예측했다. 전망대로라면 커넥티드 기기 중에서 단연 압도적인 성장세다.
보고서는 "세계 인공지능 스피커 시장은 여전히 미국이 주도하고 있지만, 올해는 동아시아, 특히 중국의 성장세가 기대된다"고 밝혔다. 보고서는 중국의 경우 지난해말 2250만대에서 올 연말까지 5990만대로 한 해 동안 166%나 급증할 것으로 내다봤다. 이는 광대역 인터넷 가입자의 13%에 해당하는 규모다. 한국과 일본도 각각 지난해보다 132%, 131% 성장할 것으로 내다봤다. 가장 큰 시장인 미국 인공지능 스피커의 성장률은 전년대비 46%로 다소 둔화될 전망이다. 미국은 지난해 6020만대에서 올해 8780만대로 46% 성장할 것으로 예상했다. 현재 미국에서는 전체 가구의 41%가 인공지능 스피커를 보유하고 있는 것으로 집계됐다.
현재 세계 인공지능 스피커 시장은 미국, 영국, 캐나다 등 영어권 국가를 중심으로 형성돼 있다. 이를 아마존과 구글이 양분하고 있는데, 선두주자인 아마존 에코를 구글 홈이 빠른 속도로 추격하고 있는 상황이다.
최근엔 중국어, 프랑스어, 독일어, 스페인어 등 다른 언어권에서도 인공지능 스피커 시장이 급팽창하기 시작했다. 특히 중국 도시에서는 성인 인터넷 이용자들의 스마트 스피커 보유율이 22%로 미국의 19%를 앞질렀을 정도다. 중국에선 독자적으로 개발한 중국어 음성인식 기술을 토대로 IT 기업들의 인공지능 스피커 경쟁이 치열하다. 중국 시장은 현재 알리바바, 샤오미, 바이두가 트리플 체제를 형성하고 있다. 캐널리스 보고서는 올해 시장점유율은 알리바바의 티몰 지니가 39%, 샤오미의 샤오에이아이가 25%, 바이두의 듀어로스가 24%를 차지할 것으로 내다봤다. 아마존과 구글은 아직 중국시장에 진출하지 않고 있다. 애플 홈팟이 지난 1월 중국에 진출했지만 아직 점유율을 논할 단계는 아니라고 보고서는 덧붙였다.
음성비서 단 기기는 25억대...구글 "10억대에 탑재"
인공지능 스피커의 소프트웨어인 음성비서 시장은 훨씬 더 넓다. 바이두는 지난 1월 자사의 음성인식 소프트웨어인 `듀어로스 어시스턴트'가 가전제품을 비롯해 모두 2억대가 넘는 기기에 적용됐다고 발표했다. 아마존은 1억대, 구글은 10억대에 자사의 음성인식 소프트웨어가 탑재돼 있다고 밝힌 바 있다. 전 세계 음성비서 시장은 2018년 현재 25억대에 이르는 것으로 추정된다. 2023년까지 80억대로 늘어날 것이라는 전망도 나와 있다.
보고서는 인공지능 스피커가 급성장하면서 올해 스마트워치, 피트니스 워치 같은 웨어러블기기 시장을 넘어서는 데 이어, 2021년에는 4억대로 규모가 커지면서 태블릿까지도 추월할 것으로 내다봤다.
향후 인공지능 스피커의 잠재적 수요는 스마트폰보다 더 높을 수 있다고 딜로이트는 분석한다. 집은 물론 사무실, 호텔, 병원, 학교, 음식점 등 사람이 있는 모든 공간에 설치할 수 있기 때문이다. 굳이 손가락을 움직여 버튼을 누르거나 스크린을 터치할 필요없이 입만 뻥긋하면 기기를 제어할 수 있는 것이 가장 큰 장점이다. 특히 2억5천만명에 이르는 전 세계 시각장애인, 7억명(전세계 인구의 14%)에 이르는 문맹자들에겐 스마트폰보다 훨씬 편리하고 유용한 커넥티드 기기가 될 수 있다. 기기 작동에서 손과 눈을 해방시킨 덕분이다.
시장 확대의 관건은 음성인식의 정확도다. 영어의 경우 초기엔 표준발음을 벗어나면 인식의 정확도가 30% 아래로 떨어졌다고 한다. 딜로이트는 그러나 "이제는 구글 스피커의 경우 영어 음성 인식 오류율이 2016년 7월 8.5%, 2017년 5월 4.9% 등으로 꾸준히 하락하고 있다"고 밝혔다. 딜로이트의 영국 파트너이자 전세계 TMT 연구책임자인 폴 리는 인공지능 스피커의 잠재력을 이렇게 표현했다. "웹이 진정한 세계적 웹이 되려면 모든 사람이 글을 깨치거나 모든 사람이 음성으로 컴퓨터를 활용할 수 있어야 한다. 후자가 더 쉬운 길일지도 모른다."
곽노필 선임기자 ■
곽노필의 미래창 바로가기