디엔에이(DNA)는 모든 생물체에 생명을 불어넣으며 대대손손 생명을 유전하는 데 필요한 생명의 기본 설계 정보다. 아데닌(A), 티민(T), 구아닌(G), 시토신(C)이라는 4종의 염기 분자가 사슬로 이어져 디엔에이라는 자연의 고분자 정보저장고를 구성한다. 염색체에 놀랍도록 촘촘하게 담긴 염기 사슬 정보는 다양한 단백질을 만들어 갖가지 생명 현상을 연출한다. 어떻게 무궁무진한 생명 현상의 정보를 이처럼 작은 고분자 물질 안에 다 담아낼 수 있을까?
우리 컴퓨터의 디지털 정보를 이 작은 디엔에이에 저장할 수 있지 않을까 하는 아이디어가 처음 나온 건 1960년대였지만, 최근 몇 년 새 그런 구상이 현실이 되고 있다. 실제로 책은 물론이고 컴퓨터 프로그램, 사진, 영화, 녹음 파일 같은 다양한 형식의 정보를 디엔에이에 담아낸 연구 결과들이 이어지고 있다. 물론 정보를 저장하고자 인공으로 합성해 만든 디엔에이는 자연의 디엔에이와 달리 생물학적인 기능을 하지는 않는다.
1878년 최초의 동영상 ‘달리는 말’. 미국 하버드대학 연구진은 동영상 파일의 디지털 정보를 살아 있는 대장균의 DNA에 저장했다가 복원하는 데 성공했다.
최근엔 살아 증식하는 대장균의 디엔에이에다 1878년 최초의 동영상인 ‘달리는 말’의 파일을 저장했다가 다시 그 정보를 읽어내어 동영상으로 복원해 보인 연구가 <네이처>에 실려 화제가 됐다. 미국 하버드대의 조지 처치 연구진이 발표한 이 연구는 살아 있는 생물체의 디엔에이도 정보저장소로 쓸 수 있음을 입증해주어, 마치 공상과학영화의 한 장면 같은 상상력을 불러일으키며 눈길을 끌었다.
디지털 정보와 염기 정보를 서로 바꾸어 디엔에이를 대용량의 정보저장고로 쓸 수 있다는 것은 이미 최근의 다른 연구들에서도 큰 진전을 이룬 바 있다. 2012년 조지 처치 교수 연구진은 염기 A, C를 0으로, G, T를 1로 치환하는 방식으로 영문 5만3400자 분량의 책과 이미지 파일, 자바스크립트 프로그램을 디엔에이에 담아 <사이언스>에 발표한 바 있다.
곧이어 2013년 초 훨씬 더 효율적이고 정확도가 높은 저장 기법을 개발해 더 많은 정보를 더 정확하게 담는 기록 도전이 이뤄졌다. 유럽생물정보학연구소(EBI) 연구진(책임연구 닉 골드먼)은 <네이처>에 낸 논문에서, 셰익스피어의 시 154편, 마틴 루서 킹 목사의 25초 육성 연설, 제임스 왓슨과 프랜스시 크릭의 논문 1편, 그리고 디엔에이에 디지털 정보를 저장하는 방법을 757킬로바이트(KB) 규모로 담았다가 다시 이것을 그대로 복원하는 데 성공했다고 밝혔다.
디지털 정보를 고분자 물질인 합성 디엔에이 안의 염기서열 정보로 저장할 수 있다. 게티이미지뱅크 제공
올해에도 신기록이 이어졌다. 지난 3월엔 미국 컬럼비아대 등 연구진이 1g의 디엔에이에 무려 215페타바이트(PB), 즉 2억1500만기가바이트(GB)의 정보를 담을 만한 집적도를 구현하는 기법을 개발했다. 이들은 1895년 최초의 영화 <열차의 도착>과 컴퓨터 바이러스, 컴퓨터 운영체제, 아마존 선물카드 등 정보들을 합성 디엔에이에 담고, 또 그 정보를 복원해냈다. 현재로선 최고 기록의 집적도이다.
정보를 저장하는 매체로서 디엔에이만의 장점은 뭘까? 왜 정보를 저장하는 합성 디엔에이 연구에 여러 연구자가 몰려들고 있는 걸까?
정보저장용 디엔에이의 합성 기법을 연구하는 하태환 한국생명공학연구원 연구단장(위해요소감지 BNT연구단)은 분자 수준의 작은 공간에다 엄청난 양의 정보를 아주 오랫동안 보관할 수 있다는 점이 합성 디엔에이의 매력이라고 설명했다. 6만년 전 매머드의 디엔에이에서 염기서열 정보를 읽을 수 있을 정도로, 저온과 저습 같은 환경 조건만 갖춰진다면 디엔에이 정보는 이론상 수만년 동안 보존될 수도 있다. 특히 그는 “플로피디스크, 시디롬, 디브이디롬, 유에스비처럼 정보 저장 플랫폼과 읽는 장치가 계속 바뀌지만, 디엔에이 염기서열을 해독하는 기술은 사라지지 않을 테니 수많은 세대 뒤에도 그 정보를 복원할 수 있다”고 말했다.
하지만 디엔에이 정보저장 방식이 지금의 디지털 방식을 다 대체하진 못할 것으로 보인다. 하 연구단장은 “디지털 매체는 빠르게 연산하고 또 정보를 썼다 지웠다 할 수 있는 데 비해 디엔에이는 한번 정보를 저장하면 고치기 어려워, 현재로선 아주 방대한 자료를 아주 오랫동안 보관하는 용도로 제한될 것”이라고 평했다.
지난해 <네이처>의 보도에 실린 예측을 보면, 저장해야 할 정보는 갈수록 빠르게 늘어나 2020년쯤엔 44조기가바이트에 이를 것으로 전망됐다. 이런 규모는 2013년과 비교해 10배 늘어난 수치이다. 이처럼 빠르게 늘어나는 정보 저장량을 지금의 정보 저장기술이 따라가기 어렵고, 그래서 보존할 대량 정보를 따로 저장할 새로운 저장 수단이 필요해지기에 작은 분자 공간에 엄청난 정보를 기록할 수 있는 디엔에이에 대한 관심은 앞으로도 커질 수밖에 없다는 것이다. <네이처>는 박테리아의 유전자에 담긴 정보 집적도 수준으로 정보를 디엔에이에 집어넣는다면, 이론적으로 계산할 때 세상의 모든 정보를 담는 데엔 1㎏의 디엔에이만으로 충분하리라는 계산도 제시했다.
디엔에이 정보를 합성하고 해독하는 기술이 발전해 디지털 정보와 염기 정보를 쉽게 변환할 수 있는 시대가 다가오면서, 디엔에이가 컴퓨터를 해킹할 수 있다는 경고도 나왔다. 지난 11일 해외 매체 <와이어드>의 뉴스를 보면, 미국 워싱턴대 연구진은 최근 열린 ‘2017 유닉스 보안 심포지엄’에서 디엔에이에 악성 코드를 심어놓는다면 컴퓨터가 디엔에이 염기서열을 읽어들이면서 감염돼 해킹의 통로를 열어줄 수도 있다고 경고했다. 디엔에이를 통한 컴퓨터 해킹도 이론적으로 가능하다는 것이다. 발표한 논문에서 이런 위험을 시연한 연구진은 <와이어드>의 뉴스에서 “단지 네트워크 연결이나 유에스비, 또는 사용자만이 아니라 컴퓨터가 읽어들이는 디엔에이 염기서열 정보도 전에 없던 새로운 위협이 될 수 있다”고 말했다.
하 연구단장은 “합성 디엔에이에 디지털 정보를 담는 기술은 최근 몇 년 새 거의 대부분이 실증됐다”며 “디엔에이 정보를 읽는 기술의 비용이 크게 떨어진 지금엔 디엔에이 합성 비용을 얼마나 더 낮출 수 있느냐에 따라 정보저장고 디엔에이의 상업적인 활용 여부가 결정될 것으로 보인다”고 말했다.
오철우 선임기자
cheolwoo@hani.co.kr