카카오브레인이 개발한 ‘칼로’ 모델이 생성한 샘플 이미지. 카카오브레인 제공
찾고자 하는 상품 이미지를 입력하면 인공지능(AI)이 정확한 상품명과 상품평까지 알려주는 검색 서비스가 상용화됐다.
네이버는 2일 자체 구축한 멀티모달 인공지능(AI) ‘옴니서치’를 활용한 새 검색 서비스 ‘멀티모달 문서검색’을 선보였다. 해당 검색 기술은 멀티모달 인공지능을 활용해 사용자가 입력한 이미지·텍스트 등의 의도를 분석해 맞춤형 검색 결과를 제공하는 게 특징이다.
멀티모달 인공지능은 차세대 검색환경의 핵심 기술로 꼽힌다. 멀티모달 인공지능은 사람이 시각과 청각을 통해 사물을 인식하는 방식과 동일하게 인공지능이 다양한 이미지와 텍스트를 받아들여 스스로 사고하고 학습하는 기능을 말한다. 기존 텍스트 중심의 검색과 달리 이미지와 텍스트, 음성 등을 조합하는 방법으로 훨씬 정확하고 빠르게 원하는 정보를 찾을 수 있다.
네이버의 멀티모달 문서검색 기능은 우선 운동화 제품군에 적용됐다. 찾고자 하는 운동화의 이미지를 올리면 정확한 제품명과 이전 사용자가 남긴 후기, 해당 제품을 활용한 코디 정보를 한 번에 볼 수 있다. 서비스는 네이버 이미지 검색 서비스인 ‘스마트렌즈’와 연동돼 구현된다. 네이버 이미지 검색 결과에서 스마트렌즈 아이콘을 클릭하거나 스마트렌즈로 운동화 이미지를 업로드 한 뒤 검색 결과보기를 클릭하는 식으로 이용할 수 있다.
네이버가 자체 구축한 멀티모달 인공지능(AI) ‘옴니서치’를 활용한 신규 검색 서비스를 선보였다. 네이버 제공
멀티모달 인공지능 기술은 이용자가 입력한 제시어를 바탕으로 고품질의 이미지를 만들어내는 데도 활용되고 있다. 카카오브레인이 최근 공개한 인공지능 아티스트 ‘칼로’는 1억2천만장 분량의 텍스트·이미지를 학습해 이를 바탕으로 새로운 스타일의 이미지를 생성하는 기술로 주목받았다.
예를 들면, ‘르네 마그리트 화풍으로 그린 아보카도 얼굴을 한 남자’라는 제시어를 입력하면 인공지능이 이를 이해해 아보카도 얼굴을 한 남성의 모습을 르네 마그리트 화풍으로 그려내는 방식이다. 이런 기술은 교육 및 발표에 필요한 시각자료 제작과 신규 브랜드 로고 디자인 제작 등 창의성을 필요로 하는 작업에 활용할 수 있다.
전문가들은 멀티모달 인공지능이 산업계 전반에 활용돼 우리의 일상을 변화시킬 것이라고 전망한다. 사람의 눈으로 알아낼 수 없는 질병을 인공지능이 발견해 치료하거나 테러범이나 범죄자의 이미지를 분석해 폐쇄회로텔레비전(CCTV)에서 실시간으로 찾아내는 분야에도 해당 기술이 활용될 수 있다. 다만 유명인을 모방한 딥페이크 등이 범죄에 악용되거나 폭력적·성적인 이미지를 만들어내는데 기술이 악용될 수 있다는 우려도 있다.
옥기원 기자
ok@hani.co.kr