오철우 ㅣ 서울과학기술대 강사 (과학기술학)
생명은 디엔에이(DNA)의 유전자에서 비롯하지만, 생명현상을 실제로 작동하는 것은 유전자에 의해 만들어지는 단백질이다. 인체에서 단백질은 근육, 장기, 피부를 만들고, 또한 세포와 몸을 살아 움직이게 하는 갖가지 분자 작용을 일으킨다. 면역 항체나 인슐린도 단백질이다.
그런데 단백질의 3차원 구조라는 문제가 연구자들을 애먹여왔다. 여러 종의 아미노산이 사슬처럼 이어진 단백질은 이리저리 접혀 정교한 3차원 구조를 갖추는데, 그 구조가 기능을 좌우한다. 잘못 접힌 단백질은 다른 반응을 일으키고 질병을 일으킬 수 있다. 그래서 어떤 단백질의 3차원 구조가 어떤 모양이냐는 질병과 신약 연구에서 중요한 관심사일 수밖에 없다.
문제는 그런 3차원 구조를 밝히는 게 쉽잖다는 점이다. 값비싼 관측실험 장비가 있어야 하고 많은 시간과 노력이 필요하다. 까다로운 단백질은 규명하는 데 몇년이 걸릴 수 있다. 그런 단백질이 사람 몸에 수만종이 있고, 바이러스와 박테리아를 포함해 자연계에 수십억종인 것으로 추산된다.
세계 각지 연구자들은 1994년부터 실험이 아니라 컴퓨터 모형 분석만으로 단백질 구조를 빠르게 예측해 그 정확성을 겨루는 국제대회(CASP)를 격년마다 벌여왔다. 그동안 꾸준히 발전이 이뤄졌다. 그런데 14회째인 올해 대회에서 ‘도약’이 일어났다. 2016년 알파고 충격을 일으킨 구글 딥마인드 연구진이 만든 인공지능 알파폴드가 놀라운 정확도로 우승을 차지한 것이다. <뉴욕 타임스>를 비롯해 많은 언론매체와 전문가들은 “질병과 신약 연구에 혁명을 일으킬 것”, “판을 바꾸는 게임 체인저”라는 평가를 쏟아냈다.
알파폴드의 비법은 수많은 바둑 기보를 스스로 학습하며 이기는 수의 패턴을 찾아낸 알파고의 방법과 비슷하다. 지금까지 실험을 통해 규명된 단백질 17만종의 3차원 구조가 학습 자료로 활용됐다. 아미노산 서열이 어떤 3차원 구조를 만드는지를 예측하는 알고리즘은 훈련을 거치며 정교해졌다.
알파폴드 같은 인공지능의 등장은 질병 연구와 신약 개발의 판을 바꾸는 계기가 되리라는 전망도 많다. 질병 메커니즘 연구와 단백질 구조에 맞춘 신약의 개발 속도가 빨라질 것이고, 플라스틱을 분해하는 효소 단백질의 발굴과 개발처럼 다른 영역의 연구를 확장할 수 있다. 당장엔 26년 동안 비교적 간단한 단일 단백질의 구조 예측 실력을 겨뤄왔던 국제대회도 이제는 아주 복잡한 단백질 복합체의 3차원 구조를 푸는 식으로 출제 문제의 수준을 한 차원 높일 계획인 것으로 알려졌다. 알파폴드 사례는 모든 분야는 아니겠지만 과학 연구에서 인공지능과 연구자의 협력이 앞으로 더욱 긴밀해질 것임을 보여준다.