미스 유니버스 대회 참가자들의 리허설 모습. 위키미디어
컴퓨터가 인간 외모의 아름다움을 공정하게 인식할 수 있을까? 사상 최초로 인공지능(AI) 로봇이 심사를 맡은 세계 미인대회 ‘뷰티 닷 에이아이(Beauty.AI)가 뜻밖의 ‘인종주의’ 논란에 휩싸였다.
인공지능 심사 미인대회는 지난 7월 한달 동안 세계 100여개국에서 6000여명의 참가자들이 제출한 인물 사진을 인공지능 로봇이 심사하는 방식으로 이뤄져 큰 관심을 모았다. 그러나 8월 2일 인공지능 로봇이 명백하게 편향적인 심사 결과를 내놓자, 심사 알고리즘 설계자들이 상당히 실망했다고 영국 <가디언>이 8일 보도했다. 알고리즘은 컴퓨터가 주어진 과제를 수행하는 절차, 또는 이를 위해 프로그래밍된 명령어들의 집합을 뜻한다.
인공지능이 선택한 최종 수상자 44명의 대다수는 ‘밝은색 피부’, 그러니까 백인 여성들이었다. 아시아계 수상자는 손에 꼽을 정도였고, 어두운 색 피부를 지닌 수상자는 한 명도 없었다. 대회 참가자 중 백인이 가장 많았다지만 인도와 아프리카 출신 등 ‘유색 인종’ 참가자들도 꽤 많았다는 점에 비춰, 명백한 ‘피부색 차별’이었다. 이런 심사 결과는 인공지능의 알고리즘이 어떤 방식으로 편향성을 보이며 ‘의도하지 않았거나 불쾌한 결과’를 내놓는지에 대한 논쟁에 새삼 불을 붙였다고 <가디언>은 전했다.
지난 7월 진행된 세계 최초의 ‘인공지능 심사 미인대회(Beauty.AI)’의 인터넷 홈페이지.
이번 미인대회는 ‘청년 실험실(Youth Laboratories)’이라는 ‘딥 러닝’ 연구 그룹이 조직하고 마이크로소프트(MS)사가 후원했다. ‘딥 러닝(deep learning·심화 학습)은 컴퓨터가 다량의 빅데이터나 복잡한 자료들 속에서 핵심 내용을 요약하고 해법을 찾는 학습 과정으로, 지난 3월 이세돌 9단과 알파고와의 바둑 대결 당시 일반에 널리 알려진 용어다. 인공지능의 미인 심사는 수많은 인물 사진들로 구축된 데이터베이스를 분석해 아름다움을 판단하는 알고리즘이 기본 원리다. 사람 얼굴의 대칭, 주름 등 매력을 평가할 수 있는 객관적 지표를 사용한다.
인공지능 알고리즘이 백인을 선호한 가장 큰 원인은 매력적인 용모의 기준 설정을 위해 입력된 인물사진 데이터들에 다양한 피부색의 인물 사진들이 충분하지 않았기 때문이다. 이번 대회의 기술 책임자인 알렉스 자보론코프는 “다양한 피부 색의 데이터를 갖고 있지 않다면 사실상 편향된 결론을 낼 수 있다”고 말했다. 기술진이 알고리즘을 설계할 때 밝은 색 피부를 아름다움의 징표로 설정하지는 않았다지만, 입력된 데이터들을 보면 인공지능이 사실상 그런 결론을 내도록 유도된 셈이다.
이번 심사 결과는, 컴퓨터 알고리즘이 ‘중립적이고 객관적’일 것이란 믿음과 달리, 입력 데이터에 따라 얼마든지 기존의 선입견을 재생산하거나 확대할 수 있다는 걸 보여준다. 미국 콜럼비아대의 정치학자이자 법학자인 버나드 하코트 교수는 “인공지능 미인 심사의 결과는 이런 문제점의 완벽한 예시”라며 “아름다움에 대한 문화적, 인종적 중립성을 확립할 수 있다는 생각은 믿기 어렵다”고 말했다.
앞서 지난 3월 마이크로소프트가 선뵌 채팅 로봇 ‘테이’는 대화를 시작한지 얼마 되지도 않아서 인종주의적 언어를 구사하고 트위터에 네오나치 시각을 드러내는 글을 올리기도 했다. 뿐만 아니라 지난달에는 페이스북이 시사 뉴스를 선별해 올리는 ‘인간 편집자’를 없애자마자, 페이스북 알고리즘이 스스로 엉뚱하게 이야기를 지어내거나 “‘한 남자가 치킨 샌드위치로 자위 행위를 했다”는 따위의 외설적인 글을 ‘뉴스 피드’에 올려 충격을 주기도 했다.
시민적 자유권 옹호단체들은 컴퓨터가 기존 데이터를 이용해 미래에 범죄가 일어날 지역을 예측해주는 시스템이 결함 투성이 데이터에 의존해 인종주의적 편견과 잘못된 치안 행정을 악화할 가능성에 대해서도 우려를 표명하고 있다고 <가디언>은 전했다. 미국 비영리기구인 미디어정의센터의 말키아 시릴 사무국장은 “오염된 데이터가 오염된 결과를 낳는다“고 말했다.
조일준 기자
iljun@hani.co.kr