본문 바로가기

광고

광고닫기

광고

본문

광고

경제 IT

“원본 찾기 어렵네” 펌글 넘치는 네이버

등록 2010-12-07 09:03수정 2010-12-07 09:10

11월24일치 기사 ‘갤럭시S도 데이터 삭제없이 업그레이드’를 국내외 검색엔진에서 검색해 그 결과를 비교해봤다. 구글, 네이트, 다음에선 신문사의 기사 원문이 첫번째와 두번째로 나왔다. 네이버에서는 원본 기사가 13번째로 밀려났으며 기사 앞에 노출된 검색 결과 8개는 제목 그대로 복사해간 콘텐츠였다. (※ 이미지를 클릭하면 크게 볼 수 있습니다)
‘오리지널’글 뒤로 밀리고
검색 아예 안되는 경우도
“생산·복제 활발하기 때문”
“모르면 네이버에 물어봐?”

지식검색과 통합검색 등 한국형 서비스를 앞세워 70% 안팎의 점유율을 자랑하는 엔에이치엔(NHN) 네이버의 검색 품질에 문제가 있다는 지적이 일고 있다. 국내 검색의 대명사로 꼽히는 네이버이지만, 정작 네이버 바깥에 있는 콘텐츠는 잘 검색되지 않는데다, 원본보다 ‘퍼온 글’ 등 복사본이 우선노출되는 등 검색 결과에 대한 불만이 잇따르고 있는 것이다.

#1. ‘깜신의 작은 진료소’(jinmedi.tistory.com)라는 블로그를 1년 전부터 운영해온 전문의 김종엽씨는 최근 자신의 블로그 내용을 네이버에서 검색하고는 깜짝 놀랐다. 자신의 글은 전혀 검색되지 않고, 이를 퍼간 글과 사이트만 검색되는 것을 발견했기 때문이다. 김씨가 항의하고 나서자, 네이버 쪽은 ‘실수’라며 곧바로 검색 결과에 포함시켰다. 파워블로거 ‘광파리’로 알려진 김광현 <한국경제신문> 정보기술전문기자가 운영하는 블로그 ‘광파리이야기’(blog.hankyung.com/kim215)도 유사한 경우다. ‘광파리가 간추린 아이폰4의 7가지 특징’ 같은 블로그의 글들을 검색해보면, 네이버엔 이를 복사한 블로그와 카페의 글은 노출되지만 원저작자의 글은 찾을 길이 없다. 광파리의 블로그 글 대부분이 네이버에선 검색되지 않는 것이다. 이와는 달리 두 사람의 블로그 글을 다음·네이트·구글에서 검색해보면 대개 첫번째나 두번째로 나온다.

#2. 지난달 24일치 <한겨레>에 실린 ‘갤럭시S도 데이터 삭제없이 업그레이드’ 기사를 인터넷에서 검색해봤다. 구글·네이트·다음의 검색 결과에서는 해당 기사를 블로그나 카페에 퍼간 콘텐츠도 상당 부분 검색이 됐지만 <한겨레> 기사가 맨 먼저 나왔다. 하지만 네이버에서 검색한 결과는 전혀 달랐다. 기사를 일부 혹은 몽땅 복사해간 블로그·카페가 우선노출되고 해당 기사는 13번째로 밀렸다. 기사보다 먼저 나온 12개 결과 중 8개가 기사와 제목을 그대로 퍼간 콘텐츠다. 맨 위에 노출된 콘텐츠는 한 학원의 게시판으로, 네이버 블로그다. 이 블로그는 수많은 기사를 마구잡이로 복사해놓고 검색어를 이용해 마케팅을 하는 곳이었다. 다른 기사들을 검색해봐도 기사보다 퍼간 글이 주요하게 노출되는 현상은 네이버에서 유난히 심했다.

공들여 쓴 ‘오리지널’ 글은 제대로 검색되지 않고, 이를 함부로 옮겨간 블로그와 카페의 ‘짝퉁’ 글이 특정 검색엔진에서 ‘우대’받는 현실은 왜 생겨날까? 검색엔진마다 고유의 알고리즘이 있는 탓에, 같은 검색어를 입력해도 결과는 업체별로 제각각이고 검색 시점에 따라서 결과가 매번 다르기 마련이다. 이 때문에 특정 검색어 결과를 검색엔진 전체의 문제로 일반화하는 데는 주의해야 한다. 하지만 많은 콘텐츠 창작자들은 네이버 검색 결과에 대해선 유독 퍼온 글이 원본보다 주요하게 노출되는 경우가 많고, 이는 자체 블로그와 카페를 우선 보여주면서 네이버 바깥의 콘텐츠를 ‘차별’하는 검색 알고리듬 때문이라는 주장을 편다.

이에 대해 이윤식 엔에이치엔 검색기술 이사는 “차별은 없지만, 검색로봇이 자체 보유 콘텐츠에 대해서는 다양한 부가정보(메타데이터)에 접근할 수 있어 아무래도 더 잘 검색하게 마련”이라며 “네이버가 퍼온 콘텐츠에 가중치를 주는 게 아니지만 자체 콘텐츠가 많고 그 안에서 사용자들의 활동성이 높다 보니 퍼온 글이 많이 검색되는 경향을 보인다”고 말했다. 즉 다음이나 네이트도 메타데이터를 가진 자체 콘텐츠는 검색에 더 잘 노출되지만, 이들에 비해 네이버 이용자가 훨씬 많고 생산과 복제 등 활발한 활동을 벌이는 데서 생겨나는 차이라는 것이다. 기사를 퍼간 블로그가 기사보다 주요하게 나타나는 현상은 이용자들이 원본보다 이를 복사한 블로그를 더 많이 찾는 현실이 반영된 결과라고 설명했다.


문제는 네이버 콘텐츠 안에 복제물의 비중이 높다는 점과 사용자들이 복사를 쉽게 하고 검색을 통해 이를 이용하게 만드는 순환 구조에 기인한다. 하지만 네이버 쪽은 원작과 패러디의 관계처럼 원본에 내용이 추가된 콘텐츠를 복제물로 단정하기 어렵고 창작물 간에도 품질의 격차가 커서 ‘복제시 불이익’을 무조건 적용하기는 힘들다고 밝혔다. 자체 콘텐츠가 거의 없는 구글과는 대조적이다. 구글에서도 원본을 퍼간 콘텐츠가 검색되지만, 원본보다 퍼간 글이 주요하게는 경우는 매우 드물다. 한성숙 네이버 검색품질센터장은 “네이버 검색은 사용자가 원하는 방향을 지향한다”며 “소수 창작자들의 원본 존중 요구를 반영하는 방법을 찾고 있지만 이는 전체 사용자들의 만족도가 높아지는 범위 안에서 수용될 것”이라고 밝혔다.

네이버는 높은 검색 점유율을 유지하며 다양한 콘텐츠 서비스를 확대하고 있음에도, 콘텐츠 사업과 검색 사업은 본질적으로 갈등관계다. 블로그·카페 등 네이버 콘텐츠는 검색을 위한 자산이지만, 동시에 적절성과 공정함이 생명인 검색에서 구조적으로 자체 콘텐츠가 더 잘 검색되는 것은 곤혹스러운 문제이기 때문이다.

구본권 기자 starry9@hani.co.kr


항상 시민과 함께하겠습니다. 한겨레 구독신청 하기
언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

광고

광고

광고

경제 많이 보는 기사

음식점 폐업률 전국 1위는 이 도시…집값도 급락 직격탄 1.

음식점 폐업률 전국 1위는 이 도시…집값도 급락 직격탄

“그리 애썼던 식당 문 닫는 데 단 몇 분…” 폐업률 19년 만에 최고 2.

“그리 애썼던 식당 문 닫는 데 단 몇 분…” 폐업률 19년 만에 최고

90살까지 실손보험 가입 가능해진다…110살까지 보장 3.

90살까지 실손보험 가입 가능해진다…110살까지 보장

오세훈발 ‘토허제 해제’ 기대감…서울 아파트 또 오르나요? [집문집답] 4.

오세훈발 ‘토허제 해제’ 기대감…서울 아파트 또 오르나요? [집문집답]

한화 김동선, ‘급식업 2위’ 아워홈 인수한다 5.

한화 김동선, ‘급식업 2위’ 아워홈 인수한다

한겨레와 친구하기

1/ 2/ 3


서비스 전체보기

전체
정치
사회
전국
경제
국제
문화
스포츠
미래과학
애니멀피플
기후변화&
휴심정
오피니언
만화 | ESC | 한겨레S | 연재 | 이슈 | 함께하는교육 | HERI 이슈 | 서울&
포토
한겨레TV
뉴스서비스
매거진

맨위로
뉴스레터, 올해 가장 잘한 일 구독신청