케이티(KT)가 이번달 공개한 ‘AI 휴먼 스튜디오’를 통해 인공지능 가상 인간을 만들어 뉴스를 진행하는 영상을 뚝딱 만들었다. 6개의 가상 외모와 110개의 목소리를 통해 만들어진 가상 인간들은 모든 이가 아나운서의 고용 없이 영상을 만들 수 있도록 해준다. ▶영상보기 https://aihumanstudio.ai/result/2023_11_23_22_31_05_5198378219980606.mp4
검고 긴 머리에 하얀 얼굴, 40대 중저음의 음성을 선택했다. 기자니까 종이 한 장 들고 있어 볼까? ‘가상 한겨레 임지선 기자’를 만든다는 생각으로 ‘인공지능 앵커’를 제작했다. 앵커가 읽을 대본까지 적고 나면 영상 생성을 위한 준비가 거의 끝났다. 앵커 배경 사진을 삽입하고 화면 속 앵커 위치를 조금 조정해 주고 나서 ‘영상 생성’ 버튼을 눌렀다. 뉴스 진행자를 고용하지 않고도 3분 만에 뚝딱 33초짜리 뉴스 영상이 완성됐다.
케이티(KT)가 가상 인간을 만들어 쉽게 영상 제작을 할 수 있는 ‘에이아이(AI) 휴먼 스튜디오’를 이번달 공개했다. 지난해 110개의 목소리 표본이나 자신의 목소리로 ‘인공지능 음성’을 만들 수 있는 ‘에이아이 보이스 스튜디오’를 내놨던 케이티가 한 발 더 나가 아예 사람의 형체와 목소리를 가진 ‘가상 인간’을 쉽게 만들 수 있는 대중 플랫폼을 연 것이다.
스튜디오 누리집에 접속해 회원가입을 하고 나면 강사, 아나운서, 앵커, 쇼호스트, 사회자 등 제작하고픈 가상 인간의 종류에 따라 5개의 틀(템플릿)이 보인다. ‘에이아이 앵커’를 선택하니 성별과 인종이 다른 6명의 남녀 가상인간 모델이 나타난다. 실제 촬영한 모델의 외형에 인공지능으로 만든 얼굴을 넣은, 초상권이나 저작권 문제가 없는 가상 모델이라 한다. 의상과 스타일까지 클릭 한 번으로 정하고 나면 남은 일은 뉴스 배경 사진과 대본을 입력하는 일 정도다.
발음 교정도 가능하다. 인공지능 앵커가 이상하게 발음하는 단어가 있다면 ‘스마트 단어장’에 적어 교정할 수도 있고 문장과 문장 사이에 0.2초 정도 쉬게 할 수도 있다. ‘KT’는 ‘케이티’로, ‘서비스’는 ‘써비스’로 발음하도록 했더니 훨씬 자연스러워졌다. 마음만 먹으면 인공지능 앵커의 목소리에 다섯 가지 감정(화남·슬픔·중립·침착함·즐거움)도 녹일 수 있고 5개 언어(한국어·영어·중국어·일본어·스페인어)를 구사하는 ‘능력자’로 만들 수도 있다.
그동안 ‘인공지능 가상 인간’이라 하면 ‘에이아이 김주하’, ‘에이아이 최경주’ 등 특정 기업 필요 때문에 특정 인물을 인공지능 가상 인간으로 제작하는 방식이었다. 하지만 이번에 케이티가 생성형 인공지능 전문 기업 ‘씨앤 에이아이’(CN AI)와의 기술 협력을 통해 공개한 서비스는 일반인도 쉽게 가상 인간을 활용할 수 있다. 추후 유료 버전 출시와 케이티의 초거대 인공지능 ‘믿음’ 접목 등이 예정돼 있다.
기업 고객용 ‘맞춤형 인공지능 인간’ 제작에도 나선다. 맞춤형 제작을 위해서는 의상을 갈아입어 가며 정해진 동작을 수행하는 4~8시간 정도의 스튜디오 촬영과 제시된 30문장을 정확히 읽는 과정이 필요하다. 케이티는 “실제 인간으로 인공지능 인간(AI Human)을 제작할 경우에는 일부러 절차를 복잡하게 하는 등 안전성 확보를 위한 노력을 하고 있다”고 밝혔다.
임지선 기자
sun21@hani.co.kr