챗지피티가 뉴스를 공짜로 갖다 쓴다?…“명백한 저작권 침해” : IT : 경제 : 뉴스 : 한겨레

전체
정치	정치일반 대통령실 국회·정당 행정·자치 국방·북한 외교 정치BAR
사회	사회일반 여성 노동 환경 장애인 인권·복지 의료·건강 미디어 궂긴소식 인사 엔지오 교육 종교
전국	전국일반 제주 호남 영남 충청 강원 수도권
경제	경제일반 금융·증권 산업·재계 자동차 부동산 쇼핑·소비자 IT 직장·취업 중기·스타트업 기업PR 글로벌워치
국제	국제일반 해외토픽 아시아·태평양 미국·중남미 유럽 중국 일본 중동·아프리카 국제기구·회의 국제경제
문화	문화일반 영화·애니 방송·연예 여행·여가 음악·공연·전시 학술 책&생각
스포츠	스포츠일반 축구·해외리그 야구·MLB 골프 바둑 스포츠 특집 경기일정 경기결과
미래과학	미래 과학 기술 환경 시각
애니멀피플	야생동물 반려동물 농장동물 인간과동물 생태와진화
기후변화&	기후정책 기후행동 기후과학 기후적응 에너지와기후 기후와사회
휴심정	마음산책 조현이 만난 사람 휴심정 뉴스
오피니언	사설 칼럼 왜냐면
만화 \| ESC \| 한겨레S \| 연재 \| 이슈 \| 함께하는교육 \| HERI 이슈 \| 서울&
포토	화보
한겨레TV	편성표 한겨레TV 소개 광고·후원 문의 전체 프로그램
뉴스서비스	많이본기사 날짜별한겨레 지난톱기사 디지털초판 RSS서비스 기사제보 기사투고
매거진	한겨레21 씨네21 이코노미인사이트

가 가 가 가 가

‘코로나19가 한국에 처음 발병한 날 시점에서 그 소식을 전하는 기사를 작성해 줘.’

1일 생성형 인공지능 챗지피티(ChatGPT)에게 이같은 주문을 했더니, ‘한국 최초 코로나19 확진, 새로운 바이러스에 대한 우려’라는 기사를 내놨다. “2020년 1월20일, 대한민국에서 코로나19가 최초로 확인되었다. 중국 우한에서 시작된 이 바이러스는 세계적으로 확산되고 있는 상황에서 한국에까지 도달했다. 한국 보건 당국은 지난주 중국에서 입국한 환자 중에서 첫 확진자를 발견했으며, 환자는 격리 치료 중이다.”

아직은 정확한 ‘뉴스’라고 보기는 힘들지만 날짜와 내용 등은 ‘기사’와 가깝게 작성될 수 있다는 것을 보여준 예다. 생성형 인공지능의 진보 속도를 볼 때 인공지능이 기사를 작성하는 시대가 멀지 않았음을 보여준다.

인공지능이 이같이 기사에 가깝게 글을 작성할 수 있게 신뢰할 만한 정보를 어디에서 확보한 것일까? 국내외 언론사들은 빅테크(대형 정보통신 기업)가 인공지능을 학습시키기 위해 뉴스를 무단으로 활용하고 있다고 주장한다. 공들여 취재한 콘텐츠인데 공짜로 활용하는 등 저작권을 침해하고 있다는 것이다.

온라인신문협회는 지난달 31일 “인공지능 학습은 기존 뉴스 서비스 약관에 규정된 서비스와 질적으로 다른 차원의, 원저작물을 가공한 서비스”라며 “옛 약관의 ‘연구 목적’ 조항을 근거로 동의 없이 뉴스를 무단 사용한 것은 불공정할 뿐 아니라 명백한 저작권 침해”라는 입장을 네이버·카카오·구글코리아·마이크로소프트(MS) 등 국내외 빅테크에 전달했다.

이같은 요구는 국외 언론에서 먼저 시작했다. 뉴욕타임스·월스트리트저널·워싱턴포스트·에이피(AP)통신·비비시(BBC)·가디언 등 50개 이상 미디어 그룹이 가입한 기구인 ‘디지털 콘텐츠 넥스트’(DCN)는 지난 6월 “생성형 인공지능 시스템이 학습이나 결과물을 산출하기 위한 목적으로 언론사들의 콘텐츠를 이용하는 행위 대부분이 저작권법 위반 예외로 허용되는 ‘공정 이용’ 위를 넘어선다”며, 지식재산권 보호, 투명성, 책무성, 공정성, 안전성 등을 보장하기 위한 ‘생성형 인공지능 개발 및 거버넌스를 위한 7가지 원칙’(표)을 만들어 공개했다.

아예 미국 뉴욕타임스는 최근 누리집 이용약관을 ‘사전 합의 없는 인공지능 학습 목적의 데이터 활용을 금지한다’는 내용을 새로 넣었다. 로이터·시엔엔(CNN)·뉴욕타임스 등 언론사와 전자상거래 기업 아마존 등은 지난달 초 ‘챗지피티’(ChatGPT) 개발사인 ‘오픈에이아이’(OpenAI)의 웹 크롤링(데이터 긁어모으기) 도구 ‘지피티봇’의 누리집 접근을 차단하기도 했다.

언론사들의 이같은 대응은 빅테크가 뉴스를 기반으로 인공지능을 개발하는 것이 언론사의 존재를 위협할 수 있다고 보기 때문이다. 월스트리트저널을 발행하는 다우존스의 최대 주주 ‘뉴스코프’의 로버트 톰슨 최고경영자는 “생성형 인공지능의 검색 결과는 언론사들의 엄청난 노력과 통찰력을 담고 있지만, 결과적으로 독자들이 언론사 누리집에 더는 방문하지 않게 설계됐다”고 말했다.

그러나 빅테크는 인공지능 학습용으로 뉴스를 활용하고 있는지조차 정확히 알리지 않고 있다. 최수연 네이버 대표는 지난달 24일 거대언어모델(LLM) ‘하이퍼클로바엑스(X)’를 정식 출시하며 “지금까지 뉴스 콘텐츠를 얼마나 학습했는지 등은 기존의 규제와 약관에 근거한 것이기에 밝히기 어렵다”고 말을 아꼈다. 이어 “앞으로 (언론사 데이터를) 학습에 활용하는 부분에 대해서는 여러 창구가 있으니 계속 긴밀하게 협의하며 동의도 받고, 싫다고 하시는 부분에 대해서는 활용하지 않는 쪽으로 계획을 잡고 있다”고 입장을 밝혔다.

카카오는 한겨레에 “미국 비영리단체 커먼크롤이 개방형 접근(오픈소스) 방식으로 공개한 데이터만 사용하고 있다. 학습 데이터 저작권이나 인공지능이 생성한 콘텐츠의 저작권과 관련한 논의가 국내에서 막 시작되는 단계인 만큼 필요하다면 적극 참여하겠다”고 밝혔다.

빅테크가 ‘논의에 참여하겠다’ 정도로 입장을 밝힌만큼 ‘뉴스 학습 데이터 유료화’ 등 언론사 요구와는 아직 간격이 크다. 이대희 고려대 법학전문대학원 교수는 “스태빌리티에이아이(AI), 미드저니 등 이미지 생성 인공지능 기업들이 저작권 침해를 주장하며 소송을 건 화가들에게 ‘구체적으로 어떤 저작물을 베꼈다는 것인지 알려달라’는 식으로 응수했다”며 “한국을 포함한 대부분 국가가 저작권 침해를 주장하는 쪽에 침해 사실 입증 책임을 지우고 있어 법적 다툼까지 가더라도 언론사들이 불리할 수 있다”고 말했다.

염호준 법무법인 태평양 변호사는 지난 7월 한국지능정보화진흥원(NIA)이 연 토론회에서 “2000년대 초반 엠피스리(MP3) 기술이 처음 나왔을 때 불법 파일 복제·전송을 방조한 소리바다 등 음원 공유 서비스들에 법적 책임을 물은 전례가 있다”고 소개했다. 저작권 보호를 위한 필터링 등 기술 발전에 따라 논의의 접점을 찾을 수 있다는 주장이다.

인공지능 개발 기업과 언론사가 학습용 데이터와 기술 활용권을 맞바꾸기로 한 사례도 있다. 미 통신사 에이피는 1985년부터 생산한 뉴스 콘텐츠를 챗지피티 학습에 쓸 수 있도록 오픈에이아이에 제공하는 대신, 인공지능 기술에 대한 우선 접근권을 확보했다고 밝혔다.

정인선 기자 ren@hani.co.kr

한겨레와 친구하기

매일 아침, 매주 목요일 낮 뉴스의 홍수에서 당신을 구할 친절한 뉴스레터를 만나보세요
데일리H:730 구독 위클리h_weekly 구독
한겨레 공식 인스타그램
Follow @hanitweet
전체기사RSS RSS페이지 목록
한겨레앱

1/ 2/ 3

전체
정치	정치일반 대통령실 국회·정당 행정·자치 국방·북한 외교 정치BAR
사회	사회일반 여성 노동 환경 장애인 인권·복지 의료·건강 미디어 궂긴소식 인사 엔지오 교육 종교
전국	전국일반 제주 호남 영남 충청 강원 수도권
경제	경제일반 금융·증권 산업·재계 자동차 부동산 쇼핑·소비자 IT 직장·취업 중기·스타트업 기업PR 글로벌워치
국제	국제일반 해외토픽 아시아·태평양 미국·중남미 유럽 중국 일본 중동·아프리카 국제기구·회의 국제경제
문화	문화일반 영화·애니 방송·연예 여행·여가 음악·공연·전시 학술 책&생각
스포츠	스포츠일반 축구·해외리그 야구·MLB 골프 바둑 스포츠 특집 경기일정 경기결과
미래과학	미래 과학 기술 환경 시각
애니멀피플	야생동물 반려동물 농장동물 인간과동물 생태와진화
기후변화&	기후정책 기후행동 기후과학 기후적응 에너지와기후 기후와사회
휴심정	마음산책 조현이 만난 사람 휴심정 뉴스
오피니언	사설 칼럼 왜냐면
만화 \| ESC \| 한겨레S \| 연재 \| 이슈 \| 함께하는교육 \| HERI 이슈 \| 서울&
포토	화보
한겨레TV	편성표 한겨레TV 소개 광고·후원 문의 전체 프로그램
뉴스서비스	많이본기사 날짜별한겨레 지난톱기사 디지털초판 RSS서비스 기사제보 기사투고
매거진	한겨레21 씨네21 이코노미인사이트

전체

정치