인공지능에 대해 쏟아지는 폭발적인 관심에는 기대와 우려의 목소리가 혼재돼 있다. 픽사베이
이전 칼럼까지는 연결이라는 화두를 생태계 관점에서 다루고 있었다. 하지만 이는 잠시 미뤄두고 이번 칼럼부터는 두뇌와 인공지능 관점을 다룰 것이다. 뜬금없는 도약으로 느껴지겠지만, 원래 커넥션 시리즈의 후반에서 두뇌를 모방한 인공 지능과 그 한계를 다룰 예정이었다. 우리 두뇌는 100조 단위의 신경세포가 신호를 주고받는 연결 그 자체이기 때문이다.
커넥션 시리즈가 추구하는 목적은 과학과 인문학의 연결이다. 인간의 생각과 행동을 다루는 인문학을 과학으로 연결하려면 두뇌에 대한 이해가 필요하다. 그리고 두뇌의 구조와 작동 방식을 이해하려면 두뇌의 진화 과정을 알아야 한다. 그리고 두뇌 진화를 이해하기 위해서는 생태계에서 일어나는 진화의 원리를 알아야 한다. 이런 논리 흐름을 따라 가장 기초가 되는 생태계에서부터 칼럼을 시작했다. 이렇게 기초부터 차곡차곡 쌓아나가는 전개는 학문의 표준이지만 지루하다. 더 큰 문제는 정작 중요한 내용에 도달했을 때는 배경 지식이 별로 남아 있지 않을 가능성이다. 이런 고민이 늘어가던 중 챗지피티(chatGPT)가 등장하였다.
이 인공 지능에 대해 쏟아지는 폭발적인 관심에는 기대와 우려의 목소리가 혼재돼 있다. 어떤 이들은 인공 지능을 통해 인류의 미래가 밝아질 것이라 기대한다. 반면 어떤 이들은 미래에 먹구름을 드리울 통제 불가능한 인공지능의 시작이라 우려한다. 뭔가 익숙한 상황이다. 코로나라는 단어가 처음 등장했던 삼년 전에는 바이러스에 대한 상식을 가진 대중은 극소수에 불과했다. 하지만 팬데믹으로 확산되면서 개인의 삶에 영향을 미치기 시작하자 관심은 폭발적으로 증가했다. 관심은 지식 욕구와 연결된다. 하지만 올바른 지식을 공급할 여건이 부족했기에 인포데믹(infodemic) 현상이 나타났다. 잘못된 지식이 과학적 사실보다 더 빠르게 퍼져 사회적 혼란과 부작용을 일으킨 것이다.
상식 영역을 벗어난 파괴력 있는 이슈가 등장하면 항상 인포데믹이 뒤따른다. 지식의 탐구 과정은 지루하고, 음모론과 논리 비약은 재미있기 때문이다. 대중이 신선하고 흥미로운 것에 더 끌리는 것은 잘못이 아니다. 우리의 두뇌가 호기심에 반응하도록 진화되었기 때문이다. 이런 본능적 반응을 넘어 객관적 사실에 접근하려면 노력이 필요하다. 그런데 전에는 바이러스, 이번에는 컴퓨터. 이외에도 크고 작은 전문 분야의 이슈들. 기초 지식만 확인하기에도 너무 피곤한 세상이다. 하지만 정보의 홍수에 쓸려가지 않으려면 최소의 내용 파악은 필수다.
인간의 두뇌를 직접 실험할 수 없는 상황에서 인공 지능은 고등 지능 연구에 새로운 통찰을 제시한다. 픽사베이
두뇌와 인공지능, 얼마나 유사할까?
챗지피티의 탄생 배경에는, 고등 지능을 모방하려는 한 세기에 걸친 희망과 좌절의 역사가 있다. 인공 지능의 발전에 두뇌의 생물학적 연구가 도움이 되었다는 것은 잘 알려져 있다. 하지만 반대로 인공 지능이 두뇌 연구에 도움을 주는 것은 잘 알려져 있지 않다. 인간 두뇌를 다루는 뇌과학 영역은 중요하고도 어렵다. 내용 자체도 난해하고, 미지의 영역도 너무 많다. 호모 사피엔스는 진화 역사상 가장 지능이 뛰어나다. 이는 고등 지능의 실험 대상이 인간밖에 없다는 뜻이다. 인간 대상 연구에는 강력한 기술적 윤리적 제한이 필요하다. 사람의 두개골을 열고 전선을 연결하고 약물을 주입하고, 반응을 기록해 분석을 하는 것은 연구가 아닌 인간성 말살이다. 간단해 보이는 심리 실험조차 강력한 통제를 받아야 한다. 이런 상황에서 고등 지능 연구에 새로운 통찰을 제시하고 있는 것이 인공 지능이다. 현재 인공지능과 뇌과학은 상호 보완적으로 발전하는 중이다.
아래 <그림 1>은 두뇌와 인공 지능의 유사성 비교이다. 위는 생물학적 환경에서 작동하는 두뇌, 아래는 컴퓨터에서 작동하는 인공지능이다. 먼저 두뇌를 살펴보자. 기본 단위인 신경세포(뉴런, neuron)가 연결(시냅스, synapse)되어 해부학적으로 구분되는 국소적 망(network)를 구성한다. 그리고 특정 기능을 수행하는 망 영역들이 통합적으로 연결되어 두뇌를 구성한다. 그 다음 개념화로 표시된 영역을 보자. 인공지능의 퍼셉트론(perceptron) 개념과 생물학적 뉴런의 유사성이 표시되어 있다. 뉴런의 기본 기능은 다른 뉴런들이 보낸 다수의 신호를 종합해서 다른 뉴런으로 다시 신호를 보내는 것이다. 이 기능을 개념화하면 x1, x2, x3라는 신호를 받아 y라는 새로운 신호를 출력하는 퍼셉트론이 된다. 수학 기호가 거부감을 줄 수 있지만, x는 입력! y는 출력! 이것만 알면 충분하다.
인공 지능에서는 뉴런의 신호 입출력을 모방하는 퍼셉트론이 기본 동작 단위가 된다. 하지만 이것은 뉴런처럼 실체가 있는 것은 아니고 추상적 개념에 불과하다. 따라서 컴퓨터 메모리에서 동작하는 프로그램으로 작성해야 한다. 그림에서 신경 세포와 비교되는 기능코드가 퍼셉트론 기능을 구현하는 프로그램 조각이다. 그리고 수천 수억 개의 퍼셉트론 조각을 계층을 나눠 서로 연결시키면 인공지능의 심층신경망이 된다. 인공지능 종류마다 고유한 계층 구조와 연결 방식을 가지는데 이것이 인공지능 알고리즘이다. 이 알고리즘을 구현하는 프로그램이 실제 컴퓨터에서 구동되면 우리가 접하는 인공지능이 된다.
인공 지능의 핵심인 퍼셉트론 개념화 시작은 컴퓨터 등장 이전으로 거슬러 올라간다. 20세기 초에 신경과학 영역에서 두뇌와 뉴런에 대한 발견이 쏟아져 나왔다. 특히 뉴런의 신호 전달 원리는 다른 영역의 과학자들에게 많은 영감을 주었다. 간단한 기본 기능 단위의 연결 구조가 더 복잡한 고등 기능을 가진다는 복잡계(complex system)가 실제 확인된 것이다. 그리고 1943년 뉴런의 작동 원리를 전기 신호 동작으로 개념화한 퍼셉트론 논문이 등장한다. 이는 1946년 최초의 컴퓨터로 ‘알려진’ 애니악(ENIAC, 사실 최초는 아니다. 이에 대해서는 다음 칼럼에서 튜링에 대한 이야기와 함께 다룰 것이다)의 등장과 함께 인공지능에 대한 기대를 불러일으킨다.
하지만 두뇌의 시냅스 망처럼 많은 퍼셉트론을 연결해 인공지능을 구현할 수 있다는 기대는 산산조각 난다. 실체가 있는 뉴런으로 구성되는 두뇌의 시냅스 망과 달리, 추상적 개념인 퍼셉트론 신경망을 구현하기 위해서는 프로그램이 돌아가는 컴퓨터 하드웨어가 뒷받침되어야 한다. 하지만 당시 컴퓨터는 교실 만한 덩치에도 불구하고, 지금 스마트폰 속의 손톱보다 작은 칩에도 한참이나 못 미치는 형편없는 성능을 가지고 있었기 때문이다.
사람이나 인공지능이나 학습을 해야 실력이 는다. 픽사베이
인공지능이 똑똑해진 비결은?
더 큰 문제는 심층신경망을 학습시키는 방법을 알 수 없었다는 것이다. 사람이나 인공지능이나 공부가 필요하다. 두뇌가 고등 지능을 발현하기 위해서는 뉴런이 체계적으로 연결되어야 한다. 태어나자마자 말하고, 뛰어다니고, 수학문제를 푸는 신생아는 없다. 제대로 연결되지 않은 뉴런으로 가득한 신생아의 시냅스망은 학습을 통해 재구성되고 다듬어지는 과정을 거쳐야 고등 지능을 발휘하게 된다. 마찬가지로 인공 지능의 심층신경망 퍼셉트론도 학습으로 연결이 다듬어져야 한다. 그런데 어떤 방법으로 심층신경망을 학습시킬 것인가에 대한 고민은 오랫동안 해결되지 않았다.
심층신경망 학습에 적합한 데이터 부족도 드러나지 않은 문제였다. 운동을 잘하려면 연습을, 공부를 잘하려면 문제를 많이 풀어봐야 한다. 학습에서는 먼저 시도해보고 결과를 확인해 뉴런의 연결을 다듬는 피드백이 중요하다. 인공지능도 피드백을 통해 퍼셉트론의 연결을 다듬어야 한다. 이를 강화학습이라고 한다. 사람이나 인공지능이나 많이 할수록 똑똑해진다. 학생에게 풀어야 할 연습 문제가 부족한 상황 따위는 일어나지 않는다. 하지만 인공지능에겐 학습을 위한 연습 문제가 부족했다. 정답이 명확하게 구분된 엄청난 양의 디지털 데이터가 필요하기 때문이다. 그러다 인터넷 보급이 본격화되면서 인공 지능 학습에 적합한 데이터가 빠른 속도로 축적되기 시작하였다.
인터넷의 보급은 컴퓨터의 발전도 촉진했다. 특히 게임 시장이 지면서 사실적인 그래픽을 제공하는 하드웨어 발전이 가속화되었다. 이 특화된 하드웨어를 이용하면 심층신경망 학습을 놀라운 속도로 진행할 수 있었다. 현실에서 게임은 공부의 적으로 여겨지지만. 인공 지능에서는 게임이 공부의 일등 공신인 셈이다. 하드웨어와 학습데이터가 갖추어지자 심층신경망 학습 방법에 대한 연구가 본격적으로 진행된다.
그 첫 성과는 두뇌의 시각 처리 과정 모방에서 나왔다. 우리가 개와 고양이를 구분하는 것은 별거 아니지만, 인공지능에게는 오랫동안 불가능의 영역이었다. 하지만 심층신경망의 훈련 방법, 컴퓨터 하드웨어, 학습 데이터라는 삼박자가 맞아 떨어지자 인공지능은 갑자기 똑똑해지기 시작하였다. 물론 사물을 보고 구분하는 기초적 시각 능력을 고등 인공지능이라 하지는 않는다. 시각 능력은 모든 동물의 기본이기 때문이다. 하지만 인공지능이 시각 능력을 보여준 결과에서 중요한 점은 심층신경망의 구성과 학습 방법을 알게 되었다는 것이다. 이후 한 단계 올라선 지능을 부여하기 위한 연구들이 파생된다. 그 중 대중에게 가장 널리 알려진 것이 바둑을 두는 인공 지능 알파고다. 그리고 7년 뒤 챗지피티(chatGPT)가 등장한다.
챗지피티는 심층신경망을 구성해 학습시키면 사람처럼 대화가 가능한 인공 지능이 가능하다는 걸 확인시켜줬다. 픽사베이
신경망 안에선 무슨 일이 일어나고 있을까?
챗지피티는 천억개가 넘는 퍼셉트론을 연결해 대규모 심층신경망을 구성하고, 엄청난 규모의 언어와 지식 정보를 학습시키면, 사람처럼 대화가 가능한 인공 지능이 만들어지는 것을 확인시켜줬다. 이는 단순한 기능의 기본 단위라도 엄청나게 많은 연결을 통해 고등 기능이 획득된다는, 복잡계의 창발성(emergence)을 보여주는 극적인 예다(물론 심층신경망의 기본 구조 설계와 훈련 방법은 위 설명처럼 간단하지 않으며, 이것이 인공지능의 능력을 결정하는 연구진의 노하우다). 그런데 이 창발성은 불안 요소가 되기도 한다. 두뇌의 뉴런이 어떻게 연결되어 고등 지능이 발현되는지 모르는 것처럼, 퍼셉트론이 어떻게 연결되어 인공지능이 작동하는지를 모르기 때문이다.
입력과 출력은 확인 가능한데 내부에서 일어나는 일을 모르는 심층신경망을 블랙박스로 표현하기도 한다. 이천억개에 가까운 퍼셉트론의 연결 중에 자아가 창발이 되었을 가능성은 없을까? 이 질문은 이 칼럼의 소제목이기도 한 ‘튜링 기계(chatGPT)가 꿈을 꾸는가?’라는 질문으로 바꿀 수 있다. 우리 두뇌는 잠을 자면서 시냅스 망의 회로를 다듬는다. 이 과정을 통해 깨어 있는 동안 경험한 단기적인 기억들이 장기 기억(시냅스 회로)으로 전환되어 체계적으로 저장된다. 잠을 자지 않으면 장기 회로가 잘 형성되지 않는다. 공부를 잘하려면 잠을 충분히 자라는 이유가 여기에 있다. 이런 시냅스 연결이 일어나는 동안 우리 두뇌는 꿈도 꾸고 고유한 자아도 형성한다. 따라서 인공지능이 꿈을 꾼다는 것은 자아를 가진다는 의미다. 이는 영화 ‘터미네이터’에 나온 인류를 멸망시키려는 인공지능 ‘스카이넷’의 등장 가능성으로 연결된다.
다음 시간에는 인공지능이 꿈을 꾸고 있을, 혹은 꾸게 될 가능성에 대해 이야기해보자.
주철현/울산의대 미생물학 교수·의학교육센터장