본문 바로가기

광고

광고닫기

광고

본문

광고

미래&과학 미래

기계학습의 맹점, ‘흑인=고릴라’ 오류가 알려주는 것

등록 2019-01-09 15:29수정 2019-04-05 10:09

[구본권의 사람과 디지털]
인공지능, 뛰어난 시각인식 기능 불구 맹점 못 고쳐
얼굴사진 통해 희귀질환 진단 성공

컴퓨터 시각(비전) 기술이 인공지능 기계학습을 통해 빠르게 발달하고 있다. 의학적 진단 등 분야에서 전문가를 뛰어넘는 결과가 나오고 있다.

2019년 1월7일 《Nature Medicine》에 실린 논문(Identifying facial phenotypes of genetic disorders using deep learning)은 인공지능 기계학습이 사람들의 얼굴 사진 분석을 분석해 희귀 유전적 질환을 의사보다 더 잘 진단한다는 연구결과를 전한다.

현재 헬스케어 전문가들에게 무료로 제공되고 있는 Face2Gene라는 스마트폰 앱은 딥러닝 알고리즘 기반 얼굴사진 분석 결과를 제공하는데, 신뢰도 높은 진단보조 도구로 활용되고 있다. 보스턴의 디지털 건강업체 FDNA는 독특한 얼굴 특징을 수반하는 질환인 코넬리아 드 랑에 증후군(Cornelia de Lange syndrome)과 안젤만증후군(Angelman syndrome)을 유사 질환들과 구분하는 데 처음 성공했다. 연구진은 216가지 증후군과 관련된 1만7000여장 사진을 알고리즘에 제공하고 새로운 얼굴 사진을 제시하자 Face2Gene은 정확도 65%로 의학 진단목록을 제출했다.

이 논문에는 연구진이 지난해 8월 진료중이던 한 환자의 얼굴 사진을 Face2Gene에 업로드한 뒤, 알고리즘이 제공한 진단추천을 통해 희귀 유전적 질환을 발견하는데 성공한 사례가 실려 있다. 이 무료 앱의 알고리즘 사용으로 의료진과 환자는 시일이 걸리고 값비싼 유전자 검사를 거치지 않고도 비데만-슈타이너증후군이라는 희귀질환을 확진할 수 있었다.

얼굴사진 보고 사람보다 뛰어난 ‘동성애자 감별기’ 논란

인공지능을 활용한 비전 기술의 정확도는 논란을 부른 ‘동성애자 감별기(Gayda)’ 사례에서도 확인됐다.

2017년 미국 스탠퍼드대 미할 코신스키 교수는 얼굴 사진을 분석해 동성애자 여부를 높은 정확도로 식별할 수 있다는 논문을 발표했다. 연구진은 딥러닝 기반의 인공지능을 이용해 미국의 유명 데이트 사이트에 공개된 사진 3만5000장을 분석한 결과 남성은 91%, 여성은 83%의 정확도로 동성애 여부를 식별해냈다. 이는 사람의 식별률보다 월등히 높은 결과다. 연구진은 공개된 소프트웨어와 데이터만을 활용했다고 밝혔다. 하지만 이러한 ‘동성애자 감별기’는 기업과 개인에 의한 차별적 도구로 활용될 수 있다는 우려와 윤리적 논란으로 확대됐다. 이미 구글의 페이스넷은 99.96%, 페이스북의 딥페이스는 97.25%의 얼굴인식률을 홍보한다. 이러한 정확성을 기반으로 얼굴 인식은 스마트폰의 열쇠와 결제 수단으로 활용되고 있다.

하지만 이미 인공지능이 사람보다 뛰어난 얼굴 인식 능력에 도달한 것으로 여겨지지만, 사람과 다른 맹점을 지닌다는 사실은 인공지능 기술을 실용화하는 데 커다란 걸림돌이다. 대표적 사례가 구글 포토의 자동 태깅과 분류 기능이다.

구글 포토, 흑인을 ‘고릴라’로 분류

2015년 6월 사진 자동분류 기능을 지닌 구글 포토가 흑인 사진을 ‘고릴라‘로 태깅하고 분류한 사실이 공개돼 머신러닝의 문제점이 알려졌다.
2015년 6월 사진 자동분류 기능을 지닌 구글 포토가 흑인 사진을 ‘고릴라‘로 태깅하고 분류한 사실이 공개돼 머신러닝의 문제점이 알려졌다.

구글 포토는 출시 직후인 2015년 6월, 미국에 사는 흑인 남성이 흑인 친구와 찍은 사진을 ‘gorillas’라고 분류한 사실이 당사자의 고발을 통해 공개됐다. 알고리즘에 의한 ‘인종차별’ 논란으로 이어졌고, 구글은 곧바로 “매우 잘못된 일”이라고 사과하고 수정을 약속했다.

하지만 약속과 달리, 구글은 이 기능을 제대로 수정하지 못했다. 해당 오류를 고치지 못하고 결국 문제의 키워드와 분류를 구글 포토 삭제하는 방식으로 ‘땜질’했다. 이는 미국의 정보기술 전문지 <와이어드>가 2018년 1월 실험을 통해 밝혀냈다.

<와이어드>는 구글 포토에 4만장의 동물 사진을 업로드한 뒤 어떻게 분류되는지 실험했다. 판다, 푸들 등 다양한 동물 이름을 입력했을 때, 개코원숭이·긴팔원숭이·오랑우탄 등을 검색했을 때도 알고리즘은 정확하게 해당 사진을 분류해냈다. 하지만 문제의 ‘고릴라’ 경우엔 달랐다. 구글 포토에 고릴라 사진이 들어 있음에도 ‘고릴라’ ‘침팬지’ ‘원숭이’ 단어를 입력하면 아무런 사진도 제시되지 않았다. 구글 포토 분류 알고리즘에서 ‘고릴라’와 관련 단어를 아예 삭제해버린 것이다.

구글 “고치겠다” 약속했지만, 못고치고 ‘태그 삭제’로 땜질

하지만 구글의 또다른 사진 분류 서비스인 ‘클라우드 비전’에서는 ‘고릴라’ 태그가 정상적으로 작동해, 구글의 태그 제거는 구글 서비스와 데이터 전체에 해당한 게 아니라 특정 플랫폼에만 제한적으로 적용되고 있음을 <와이어드> 실험을 통해 확인됐다.

구글의 또다른 사진 분류 서비스인 ‘클라우드 비전’에서는 ‘고릴라’ 태그가 정상적으로 작동하고 있음이  기사를 통해 확인됐다.  출처: 와이어드.
구글의 또다른 사진 분류 서비스인 ‘클라우드 비전’에서는 ‘고릴라’ 태그가 정상적으로 작동하고 있음이 기사를 통해 확인됐다. 출처: 와이어드.
<와이어드>는 알고리즘이 인종을 제대로 구분할 수 있는지도 실험했다. 1만장 넘는 다양한 인종의 얼굴 사진을 구글 포토에 업로드하고 미국에서 보편적으로 흑인을 지칭하는 ‘African American’을 입력했다. 결과는 풀 먹는 영양 사진 한 장뿐이었다. ‘black man’, ‘black woman’, ‘black person’을 차례로 입력했을 때도 제대로 기능하지 못했다. 구글 포토는 흑인 사진이 아니라 흑백사진만을 결과로 보여줬다.

방대한 데이터를 머신러닝으로 학습한 결과 알고리즘은 많은 영역에서 사람보다 뛰어난 결과를 산출하는 것으로 보이지만, 사람에겐 없는 맹점과 노골적 차별이 존재한다는 것을 알려주는 사례다. 더욱이 문제가 드러나도 고치지 못해 해당 기능을 불능화시키는 방법밖에 찾지 못했다는 것은 심각하다. 데이터와 알고리즘은 사람처럼 편견과 한계를 갖지 않고 객관적이고 과학적인 판단과 연산을 할 것이라는 기대를 받고 있지만, 현실은 전혀 그렇지 않다.

데이터와 알고리즘은 연실의 반영이고 현실은 이미 왜곡과 편견으로 가득하다. 데이터와 알고리즘 역시 마찬가지일 수밖에 없다. 현재의 알고리즘이 대부분 25살부터 50살 사이의 백인 남성들에 의해 주로 개발되고 있다는 점 또한 차별과 한계의 조건으로 기능하고 있다.

구본권 기자 starry9@hani.co.kr

항상 시민과 함께하겠습니다. 한겨레 구독신청 하기
언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

광고

광고

광고

미래&과학 많이 보는 기사

체중 감량 위한 세가지 식사법…무엇을 택하겠습니까 1.

체중 감량 위한 세가지 식사법…무엇을 택하겠습니까

셰익스피어·디킨슨 등 시보다 AI 시에 “더 좋다”…어떻게 다르길래 2.

셰익스피어·디킨슨 등 시보다 AI 시에 “더 좋다”…어떻게 다르길래

‘화성 인류촌’ 그리는 머스크…트럼프 임기 내 선물 안겨줄까 3.

‘화성 인류촌’ 그리는 머스크…트럼프 임기 내 선물 안겨줄까

태양보다 큰 9600도 ‘직녀성’, 행성 낳기 실패? 4.

태양보다 큰 9600도 ‘직녀성’, 행성 낳기 실패?

세계 최고층의 유혹…‘1km 제다타워’ 우뚝 솟는다 5.

세계 최고층의 유혹…‘1km 제다타워’ 우뚝 솟는다

한겨레와 친구하기

1/ 2/ 3


서비스 전체보기

전체
정치
사회
전국
경제
국제
문화
스포츠
미래과학
애니멀피플
기후변화&
휴심정
오피니언
만화 | ESC | 한겨레S | 연재 | 이슈 | 함께하는교육 | HERI 이슈 | 서울&
포토
한겨레TV
뉴스서비스
매거진

맨위로
뉴스레터, 올해 가장 잘한 일 구독신청