잠깐독서
빅데이터 인문학: 진격의 서막
에레즈 에이든·장바티스트 미셸 지음
김재중 옮김/사계절·2만2000원 텍스트에 쓰인 단어를 양적으로 분석해 인간 행동과 문화 트렌드를 이해하는 컴퓨터 어휘학을 컬처로믹스(Culturomics)라고 한다. 빅데이터를 바탕으로 문화적 진화 추세에 대한 그래프를 그려가는 이 새로운 학문을 만든 사람은 미국인 수학자 에레즈 리버먼 에이든과 프랑스 과학자 장바티스트 미셸이다. 이들은 특정 단어를 입력하면 1520년부터 2012년 사이에 출간된 책 800만권을 검색해 그 단어가 처음 사용된 시점은 물론이고 이후 그 사용 빈도의 증가나 감소세를 추적할 수 있는 ‘구글 엔그램 뷰어’를 개발했다. 두 젊은 과학자가 디지털 도서관을 읽는 방법으로 쓴 책은 인류 역사의 큰 그림을 보여준다. 19세기 초 1000단어마다 1번씩 언급되던 ‘신’(God)은 1973년을 기점으로 ‘데이터’라는 단어에 우위를 내주었다. 냉전시대엔 ‘사회주의’라는 말이 ‘자본주의’보다 더 많이 나왔지만 지금은 ‘자본주의’가 현격한 양적 우세를 유지하고 있다. “빅데이터가 수량화된 우리 자신을 들여다보는 창일 수 있다”는 책의 주장이 설득력 있는 이유는 꼭 800만권의 책이라는 과거의 데이터 때문은 아니다. 우리는 지금도 숫자 0과 1로 변환되는 단어로 끊임없이 우리 일상을 기록하고 있기 때문이다. 우리가 디지털로 남기는 인생기록 하나하나는 누구에 의해 어떻게 쓰여질지 모르는 빅데이터다. 남은주 기자 mifoco@hani.co.kr
에레즈 에이든·장바티스트 미셸 지음
김재중 옮김/사계절·2만2000원 텍스트에 쓰인 단어를 양적으로 분석해 인간 행동과 문화 트렌드를 이해하는 컴퓨터 어휘학을 컬처로믹스(Culturomics)라고 한다. 빅데이터를 바탕으로 문화적 진화 추세에 대한 그래프를 그려가는 이 새로운 학문을 만든 사람은 미국인 수학자 에레즈 리버먼 에이든과 프랑스 과학자 장바티스트 미셸이다. 이들은 특정 단어를 입력하면 1520년부터 2012년 사이에 출간된 책 800만권을 검색해 그 단어가 처음 사용된 시점은 물론이고 이후 그 사용 빈도의 증가나 감소세를 추적할 수 있는 ‘구글 엔그램 뷰어’를 개발했다. 두 젊은 과학자가 디지털 도서관을 읽는 방법으로 쓴 책은 인류 역사의 큰 그림을 보여준다. 19세기 초 1000단어마다 1번씩 언급되던 ‘신’(God)은 1973년을 기점으로 ‘데이터’라는 단어에 우위를 내주었다. 냉전시대엔 ‘사회주의’라는 말이 ‘자본주의’보다 더 많이 나왔지만 지금은 ‘자본주의’가 현격한 양적 우세를 유지하고 있다. “빅데이터가 수량화된 우리 자신을 들여다보는 창일 수 있다”는 책의 주장이 설득력 있는 이유는 꼭 800만권의 책이라는 과거의 데이터 때문은 아니다. 우리는 지금도 숫자 0과 1로 변환되는 단어로 끊임없이 우리 일상을 기록하고 있기 때문이다. 우리가 디지털로 남기는 인생기록 하나하나는 누구에 의해 어떻게 쓰여질지 모르는 빅데이터다. 남은주 기자 mifoco@hani.co.kr
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기