“누구나 모든 지식에 무료로 접근할 수 있는 세상”을 목표로 2001년 1월15일 문을 연 위키백과는 그동안 수많은 사람이 스스로 참여해 330여가지 언어로 작성한 6100만건 넘는 글을 쌓아 왔다. 위키백과 제공
오철우 | 한밭대 강사(과학기술학)
글도 쓰고 대화도 할 줄 아는 챗지피티(ChatGPT)는 올해 인공지능 분야에서 가장 큰 뉴스였다. 글쓰기를 중요하게 다루는 교육, 학술, 언론, 출판 분야에는 놀라움과 우려가 동시에 이어졌다. 과학계에서는 인공지능을 이용해 짜깁기한 논문이 철회되는 일도 있었다. 과학계의 전문가 그룹은 인간 필자의 책임을 더욱 강조하며 데이터 해석, 원고 작성, 논문 심사 과정에 인간의 검증 절차를 두어야 한다는 가이드라인을 최근 ‘네이처’를 통해 제안하기도 했다.
챗지피티 등장 이후 제기된 물음 중에는 ‘위키백과가 살아남을 수 있을까’도 있었다. 생성형 인공지능이 빠르게 자료를 요약하고 그럴듯한 글을 쉼 없이 써낸다면 인간 글쓰기의 가치와 경쟁력은 어디에서 찾을 수 있을까? 집단지성이 쌓은 지식의 성채로 불리는 위키백과는 지금까지 300여가지 언어로 6100만건 넘는 글을 작성하고 갱신하며 현재 방문자가 많은 세계 10위권 웹사이트 중 하나로 꼽힌다. 그런 위키백과도 글쓰기 자동기계 앞에서 무력해질 것인가?
지난 8월 싱가포르에서 열린 위키백과 참여자들의 총회인 ‘위키마니아 2023’에서는 위키백과가 맞이한 도전과 과제를 다루는 토론회가 개최됐다. 매체 보도를 보면 낙관과 비관의 전망이 오간 것으로 전해졌지만, 실용적인 낙관주의가 좀 더 두드러져 보인다. 위키백과 최고기술책임자(CTO) 설리나 데컬맨은 위키미디어재단 웹사이트에 올린 글에서 생성형 인공지능이 대체할 수 없는 위키백과의 가치를 조목조목 정리했다. 무엇보다도 콘텐츠를 만들고 다듬고 토론하고 선별하는 사람들의 집단지성을 인공지능이 따라갈 수는 없다고 강조했다.
그는 인공지능이 위키백과의 더 나은 글쓰기를 위해 적절한 도구로 주의 깊게 활용되어야 한다고 말한다. 사실 인공지능은 위키백과 안에서 낯설지 않다. 여러 편집도구를 개발해온 위키백과는 이미 2002년부터 인공지능 기술에 주목해왔다. 번역 도움과 편집 오류 교정에 인공지능 봇을 활용하고 기계학습 기술을 이용해 새로운 위키 참여자의 글쓰기를 돕는 편집도구를 갖추고 있다.
챗지피티 시대에 위키백과의 가치를 높이는 데에는 형평성이라는 또 다른 과제가 놓여 있다. 위키백과의 방대한 콘텐츠는 인공지능들의 언어 능력을 높여주는 모범적인 훈련용 데이터로 자주 사용되지만, 사실 위키백과 자체의 편향성도 곧잘 지적됐다.
남성 필자 편중 때문에 생기는 콘텐츠의 성별 격차가 일찍이 지적돼 이를 개선하려는 내부 노력이 이어져 왔다. 콘텐츠가 지리적으로 편중된 점도 풀어야 할 과제다. 지난 8일 학술지 ‘플로스 원’에는 위키백과가 가난한 나라보다 부유한 나라에서 일어나는 사건에 더 많은 관심을 기울인다는 데이터 분석 논문이 실리기도 했다.
알게 모르게 스며든 편향을 되돌아보고 개선하려는 인간 필자들의 노력은 훈련용 텍스트를 공급받아 학습하는 인공지능이 대체하기는 어려운 일이다. 그래서 인공지능을 가르치는 훈련용 데이터로서, 위키백과가 콘텐츠의 정보 편향과 지식 격차를 개선하는 일은 인공지능 시대에 더욱 중요하고 가치 있는 일이 될 것이다.