제8회 휴먼테크놀로지 어워드 대상으로 선정된 한국인터넷자율정책기구(KISO) 이용자보호 시스템(KSS)은 온라인에서 욕설·비속어가 노출되는 것을 막기 위해 실시간으로 판별하는 기능을 갖춘 서비스다. 이를 개발한 한국인터넷자율정책기구는 2009년 자율규제를 정착시키기 위해 주요 인터넷 기업들이 모여 설립했고 청소년 보호를 위한 음란물·유해 검색어 데이터베이스 구축 등의 활동을 해왔다.
최근 인공지능 개발 경쟁이 격화되면서 윤리적이고 공정한 인공지능이 중요한 화두로 부상하고 있다. 챗지피티와 같은 거대 언어 모델에 기반을 둔 대화형 인공지능은 방대한 양의 온라인 데이터를 학습한 결과물이다. 이 과정에서 데이터에 포함된 편향과 혐오 표현들을 고스란히 학습하고 모방할 가능성이 크기에 이를 사전에 걸러내는 것은 인공지능의 공정성 확보를 위한 필수 조건이다. 온라인에서 욕설·혐오표현 등을 걸러내는 키소 이용자보호 시스템이 지향하는 가치이기도 하다.
키소 이용자보호 시스템 서비스는 변형된 욕설도 잡아낸다. 대형 웹사이트나 커뮤니티, 게임 서비스의 상당수가 욕설을 스크린하는 시스템을 도입하고 있지만 ‘^^1바’, ‘D질래’ 등과 같이 욕설을 변형해 사용할 경우 잡아내기가 쉽지 않았다. 한국에서는 2020년 장애인·성소수자에 대한 혐오 발언을 그대로 학습하면서 문제가 되었던 ‘이루다 사태’를 통해 대화형 인공지능의 혐오 표현에 대한 규제가 필요하다는 공감대가 만들어진 바 있다.
키소 이용자보호 시스템이 가능했던 것은 국내 양대 포털인 네이버와 카카오가 앞서서 욕설 데이터베이스를 구축했기 때문이다. 네이버와 카카오는 댓글 등에 욕설‧비속어 등 특정 단어를 아예 입력할 수 없도록 ‘금지단어 데이터베이스’를 자체 개발해 적용해왔다. 프로그램 도입 이후 실제로 악성 댓글이 줄어드는 등 효과가 나타났다. 한국인터넷자율정책기구는 두 회사로부터 프로그램을 무상으로 제공받아 통합해, 인터넷 서비스 기업들이 자율적으로 활용할 수 있도록 응용 프로그램(API)를 만들었다. 기존에는 욕설을 차단하려면 개별 업체들이 자체 데이터베이스를 구축해야 했다. 유지 관리를 위한 비용 부담도 상당해 중·소규모 업체로서는 엄두를 내기 힘들었다.
한국인터넷자율정책기구가 네이버, 카카오로부터 받아서 통합 완료한 데이터베이스는 현재 약 60만건이다. 1차 통합 20만건(욕설 기본형 3917개)에, 2차 통합으로 50만건을 추가한 이후 중복 단어를 제거했다. 한국인터넷자율정책기구는 신규 생성되는 욕설에 대해서도 지속해서 대응할 예정이다. “향후 좀 더 체계적으로 욕설을 분류하고 관리하기 위해 세분된 카테고리 개발 및 분류 기준을 마련할 예정이다. 많은 이용자의 인권 보호를 위해 청소년 유해어, 혐오표현 등을 포함한 통합 데이터베이스 개발을 추진할 계획”이라고 한국인터넷자율정책기구쪽은 말했다. 서비스는 무상으로 제공되며 “대규모 트래픽이 발생하는 경우만 일부 과금할 계획”이라고 덧붙였다.
한귀영 사람과디지털연구소 연구위원
hgy4215@hani.co.kr