AI is learning how to create itself

AI는 스스로를 창조하는 법을 배우고 있다

사람들은 진정한 ‘지능’을 가진 기계를 만들기 위해 노력해왔다. 어쩌면 우리는 이 작업을 기계가 스스로 해나가도록 해야 할 필요가 있을지 모른다.

쐐기 모양의 머리가 달린 작은 막대기 모양의 캐릭터가 화면을 가로지르며 천천히 움직인다. 반쯤 웅크린 채 한쪽 무릎을 바닥에 끌면서 움직이고 있다. 어떻게 보면 걷고 있는 것 같기도 하다. 단지 걷는 방식이 조금 어색할 뿐이다.

하지만 루이 왕(Rui Wang)은 이 모습을 보고 기뻐하며 “매일 사무실에 들어가서 컴퓨터를 열 때마다 어떤 일이 펼쳐질지 예상할 수가 없다”고 말했다.

우버(Uber)의 인공지능(artificial intelligence, AI) 연구원인 왕은 자신이 개발에 참여한 소프트웨어 ‘POET(Paired Open-Ended Trailblazer)’이 노트북에서 밤새 실행되도록 놓아둔다. POET은 가상 봇(bot)을 위한 일종의 훈련 도장이다. 지금까지 봇들은 그다지 많은 것을 배우지 않았다. POET에서 시간을 보내는 AI 에이전트들(AI agents)은 바둑두기나 암의 징후 발견이나 단백질 접힘 예측 같은 대단한 일을 하지는 않는다. 그저 울타리와 계곡으로 이루어진 단순한 만화 같은 풍경에서 넘어지지 않고 길을 헤쳐나가기 위해 노력하고 있을 뿐이다.

그러나 여기서 흥미로운 부분은 봇이 학습하는 내용이 아닌 봇이 ‘학습하는 방식’이다. POET은 장애물 코스를 생성하고, 봇의 능력을 평가하며 평가 결과를 바탕으로 봇이 다음에 도전할 과제를 할당한다. 물론 이 모든 과정은 인간의 개입 없이 이루어진다. 봇은 비틀거리는 발걸음으로 움직이면서 시행착오를 바탕으로 조금씩 성능이 개선된다. 왕은 “언젠가 봇이 마치 쿵후 고수처럼 절벽을 뛰어넘을지도 모른다”며 기대감을 드러냈다.

아직은 기초적 수준 정도로 보일 수 있지만 왕과 동료 연구원들에게 POET은 ‘매우 똑똑한’ 기계를 만드는 새롭고 혁신적인 방법을 엿볼 수 있게 해주는 시스템이다. ‘AI가 스스로 그런 똑똑한 기계가 되도록 만드는 방법 말이다.

왕과 함께 일한 전력이 있는 제프 클룬(Jeff Clune)은 이 아이디어의 열성적인 지지자다. 클룬은 와이오밍대학교에서 시작해서 이후에는 우버의 AI 연구실에서 몇 년 동안 왕 등과 함께 이 주제에 관해 연구했다. 이제 브리티시컬럼비아대학교와 오픈AI를 오가며 연구하는 클룬은 세계 최고의 인공지능 연구소 중 한 곳의 후원을 받고 있다.

클룬은 진정한 ‘지능’을 가진 AI를 만들려는 시도를 ‘인류 역사상 가장 야심 찬 과학적 도전’이라고 부른다. 실제로 이미 AI를 만들기 위한 진지한 노력이 시작된 지 70년이 지났지만 ‘인간보다’ 똑똑한 것은 고사하고 ‘인간만큼’ 똑똑한 기계라도 만들려면 아직 갈 길이 너무나 멀다. 클룬은 어쩌면 POET이 지름길을 알려줄지도 모른다고 생각한다.

클룬은 과거에 해오던 방식에서 벗어나 새로운 길을 찾아야 한다고 생각한다.

그의 생각이 옳다면 AI를 이용해서 AI를 만드는 것이 언젠가 인간의 지능을 능가하는 기계인 ‘인공일반지능(artificial general intelligence, AGI)’으로 이어질 중요한 단계가 될 수 있다. 단기적으로도 이 기술은 우리가 다른 종류의 ‘지능’을 발견하는 데 도움을 줄 수 있다. 다른 종류의 지능이란 우리가 예상하지 못한 방식으로 해결책을 찾고 우리의 지능을 대체하는 것이 아니라 보완할 수 있는 ‘비인간 스마트(non-human smart)’를 의미한다.

진화 과정 모방

2020년 초 클룬이 오픈AI로 옮긴 지 몇 주가 지난 시점에 나는 클룬과 그런 아이디어에 관해 처음 대화를 나눴다. 클룬은 과거에 수행했던 연구에 대해서 즐겁게 이야기했지만, 현재 새로운 팀과 진행하고 있는 작업에 관해서는 입을 굳게 다물었다. 나와 대화를 나누면서 그는 내부에서 전화를 받는 대신에 사무실 밖의 거리를 이리저리 돌아다니는 편을 선호했다.

클룬이 오픈AI에 관해 했던 말은 그곳이 자신과 잘 맞는 곳이라는 것뿐이었다. 그는 “내 아이디어는 오픈AI가 품고 있는 생각과 많은 부분에서 일치한다”며 “마치 하늘에서 맺어준 듯한 완벽한 만남인 것 같다. 그들은 내 아이디어를 마음에 들어 했고 여기서 함께 연구하기를 원했다”고 말했다. 클룬이 합류한 지 몇 달 후에 오픈AI는 클룬과 우버에서 함께 일했던 팀원 대부분도 고용했다.

클룬은 매우 야심 찬 비전을 품고 있다. AI의 역사는 인간이 설계한 해결책이 기계가 학습한 해결책에 자리를 내준 사례로 가득 차 있다. 컴퓨터 비전을 예로 들자면 10년 전, 처음부터 스스로 학습하는 기계가 기존의 수작업 시스템을 대체했을 때 이미지 인식 분야의 커다란 돌파구가 등장했다. 다른 많은 AI의 성공 사례도 이와 유사하다.

AI, 그중에서도 특히 머신러닝(machine learning)에서 흥미로운 점 중 하나는 이것이 인간이 발견하지 못한 해결책을 찾아내는 능력을 가지고 있다는 것이다. 머신러닝의 이러한 능력은 우리를 놀라게 한다. 이와 관련하여 자주 인용되는 사례가 알파고(AlphaGo)(그리고 그 후속작인 알파제로(AlphaZero))일 것이다. 알파고는 겉보기에 이상한 보이는 전략을 바탕으로 바둑이라는 매력적인 게임에서 인류를 꺾었다. AI는 인간 ‘마스터’들이 수백 년 동안 연구한 내용에 대해 누구도 생각하지 못한 해결책을 찾아냈다.

오픈AI에서 현재 클룬과 함께 연구하고 있는 팀은 2018년 가상환경에서 숨바꼭질하는 법을 학습한 봇을 개발했다. AI 봇은 목표 달성을 위해 처음에 간단한 목표와 간단한 도구에서 출발했다. 간단한 목표란 ‘움직이는 장애물 뒤에 숨을 수 있는 다른 봇을 찾는 것’이었다. 그러나 봇들이 자유롭게 학습할 수 있도록 놓아두자 봇들은 곧 연구들이 예측하지 못한 방식으로 환경을 이용하는 법을 알아냈다. 봇들은 가상 세계에 시뮬레이션된 물리학의 결함을 이용해서 벽을 뛰어넘거나 심지어 통과하기도 했다.

이런 식의 예상치 못한 새로운 행동에서 우리는 AI가 새롭고 더 효율적인 방식의 알고리즘이나 신경망을 만들어내거나 또는 아예 현대 AI의 초석이라고 할 수 있는 신경망을 완전히 버리는 등의 방식을 통해 인간이 생각하지 못하는 기술적 해결책에 스스로 도달할 수 있으리라는 일말의 가능성을 엿볼 수 있다.

클룬은 지능이라는 것이 애초에 단순한 출발점에서 탄생했다는 것을 사람들에게 상기시키곤 한다. 그는 “이 접근법에 관해 흥미로운 점은 이것이 효과가 있을 것임을 우리가 알고 있다는 점”이라며 “다윈 진화의 아주 간단한 알고리즘이 우리 뇌를 만들어냈지만 우리 뇌는 우주에서 우리가 지금까지 알고 있는 가장 똑똑한 학습 알고리즘”이라고 말했다. 그의 요점은 이렇다. 만약 우리가 알고 있는 ‘지능’이 셀 수 없이 많은 세대에 걸친 유전자의 무작위성 돌연변이에 기인한다면 지능 자체보다는 훨씬 간단할 것이 분명한 그런 지능의 ‘생성 과정’ 자체를 모방하려고 해야 하는 것이 아닐까?

그러나 여기에는 또 다른 중요한 점이 있다. 지능은 진화가 목표로 하는 종착점이었던 적이 없다는 것이다. 지능은 생물이 생존하고 미래의 어려움에 맞설 수 있게 하는 수없이 많은 작은 해결책을 바탕으로 다양한 형태로 나타났다. 지능은 현재 진행 중인 개방형(open-ended) 프로세스에서 가장 흥미로운 부분이다. 이 점에서 ‘진화’는 사람들이 일반적으로 생각하는 ‘목적을 위한 수단’으로써의 알고리즘과는 상당히 다르다.

클룬과 다른 연구원들이 새로운 유형의 AI로 이어질 수 있으리라고 믿는 것은 POET이 생성하는, 겉보기에는 목적 없어 보이는 일련의 도전에서 엿볼 수 있는 ‘개방성’이다. 수십 년 동안 AI 연구원들은 인간의 지능을 모방하는 알고리즘을 구축하기 위해 노력했지만, 진정한 돌파구는 진화의 개방적 문제해결 방식을 모방하려는 알고리즘을 구축하고 거기서 무엇이 탄생할지 가만히 앉아서 지켜보는 중에 나올지도 모른다.

연구들은 이미 한 번에 하나 이상의 작업을 학습할 수 있거나 이전에 마주친 적 없는 상황에 대처할 수 있는 기계를 만드는 법처럼 AI 분야에서 가장 어려운 문제에 대한 해답을 AI가 직접 찾아낼 수 있도록 학습시키면서 머신러닝을 활용하고 있다. 일부에서는 이제 이 접근법을 사용하여 실행하는 것이 인공일반지능으로 향하는 가장 좋은 방법일 수 있다고 생각한다. 클룬은 “처음에는 그다지 ‘지능’을 갖추지 못한 알고리즘으로 시작해서 알고리즘이 스스로 인공일반지능으로 향하는 과정을 볼 수 있을지도 모른다”고 설명했다.

지금으로서는 인공일반지능이 공상 수준에 머물러있다. 그러나 그것은 아무도 인공일반지능을 만드는 법을 모르기 때문이기도 하다. AI의 발전은 단편적으로 이루어지고 있으며 일반적으로 기존 기술이나 알고리즘을 조금씩 수정해서 성능이나 정확도에서 점진적인 도약을 이루어내는 과정을 통해 인간이 주도하고 있다. 클룬은 이를 ‘무엇을 찾고 있는지 또는 얼마나 많은 ‘블록’이 필요한지 알지 못한 채 AI를 위한 구성 요소, 즉 빌딩블록(building block)을 발견하려는 시도로 규정한다. 그리고 그것은 시작에 불과하다. 그는 “언젠가 우리는 그 블록들을 모두 합치는 엄청난 과제를 떠맡아야 한다”고 말했다.

AI가 우리를 위해 직접 그런 빌딩블록을 찾아서 조립하게 하는 것은 패러다임 전환이다. 그것은 우리가 지능적인 기계를 만들고 싶은데 결과물이 어떤 모습이든 상관없으니 무엇이든 만들어서 가져다 달라고 말하고 있는 것과 같다.

인공일반지능을 달성하지 못하더라도 AI가 스스로 학습하게 하는 접근법을 활용하면 새로운 유형의 AI가 만들어질 수도 있다. 클룬은 “우리에게는 매우 뛰어난 바둑기사 이상의 무언가가 필요하다”고 말했다. 그에게 매우 똑똑한 기계를 만드는 것은 스스로 과제를 만들고 해결한 후에 또다시 새로운 과제를 만드는 시스템을 구축하는 것을 의미한다. POET은 이러한 과정을 살짝 엿볼 수 있게 해준다. 클룬은 봇에 걷는 법을 가르치고 나서 땅따먹기 놀이하는 법, 그리고 나중에는 어쩌면 바둑두는 법까지 가르치는 기계를 상상한다. 그는 “그러면 봇이 수학 퍼즐 푸는 법을 배우고 직접 퍼즐을 만들 수도 있다”며 “시스템은 계속해서 혁신할 것이므로 종착점은 정해져 있지 않다”고 말했다.

이것이 터무니없는 가정일 수도 있다. 그래도 한 가지 희망은 이러한 기계가 기후변화나 전 세계적인 질병 같은 매우 복잡한 위기를 우리가 풀어나가는 데 도움을 주면서 우리의 관념적 막다른 골목을 피할 수 있게 해줄 수도 있다는 것이다.

그러나 그런 희망을 품기 전에 일단 하나를 만들어야 한다.

뇌 만드는 법

인공 뇌를 연결하고 구성하는 방법에는 여러 가지가 있다.

신경망은 소프트웨어에 인코딩된 여러 층의 인공 뉴런으로 만들어진다. 각 뉴런은 다른 층에 있는 다른 뉴런들과 연결될 수 있다. 신경망이 연결되는 방식에 따라 결과물에 큰 차이가 발생하며 이러한 새로운 아케텍처는 새로운 돌파구로 이어질 때가 많다.

인간 과학자들이 코딩한 신경망은 시행착오의 결과인 경우가 많다. 어떤 것이 작동하고 어떤 것이 작동하지 않는지에 대한 이론은 거의 없으며 최고의 설계가 발견되리라는 보장도 없다. 그래서 더 나은 신경망 설계를 위한 추적 작업을 자동화하는 것이 적어도 1980년대 이후로 AI 분야에서 가장 뜨거운 주제 중 하나가 되었다. 이 과정을 자동화하는 가장 일반적인 방법은 AI가 가능한 많은 망 설계를 생성하도록 하고 망이 자동으로 각 설계를 적용해서 최고의 설계를 선택하도록 하는 것이다. 이는 일반적으로 ‘신경 진화(neuro-evolution)’ 내지는 ‘신경망 구조 검색(neural architecture search, NAS)’이라고 알려져 있다.

지난 몇 년 동안 이러한 기계 설계가 인간의 설계를 능가하기 시작했다. 구글의 에스테반 레알(Esteban Real)과 그의 동료 연구원들은 NAS를 사용해서 당시 인간이 제작한 최고의 신경망을 능가하는 이미지 인식 신경망을 만들었다. 이는 사람들을 매우 놀라게 한 사건이었다.

2018년에 만들어진 이 시스템은 ‘자동화된 머신러닝(AutoML)’이라고 불리며 현재 진행 중인 구글 프로젝트의 일부이다. AutoML 프로젝트 역시 NAS를 사용해서 사람이 설계한 것보다 훨씬 효율적인 딥러닝 모델 제품인 ‘이피션트넷(EfficientNet)’을 제작했고 이를 통해 더 작고 빠른 모델로 더 높은 이미지 인식 정확도를 이루어냈다.

그 후로 3년 동안 레알은 ‘처음부터 생성될 수 있는 것’의 경계를 넓히고 있다. 초기 시스템은 단순히 기존 유형의 층이나 구성 요소처럼 이미 시도되고 테스트된 적이 있는 신경망 요소들을 재배열했다. 그는 “우리는 좋은 답을 기대할 수 있었다”고 말했다.

그러다가 2020년 레알과 그의 팀은 보조 바퀴를 떼어냈다. AutoML Zero라고 불리는 새 시스템은 머신러닝을 지배하는 가장 기본적인 수학적 개념만을 사용하여 AI를 처음부터 구축하고자 한다.

놀랍게도 AutoML Zero는 자발적으로 신경망을 구축했을 뿐만 아니라 인간 설계자들이 신경망을 학습시킬 때 사용하는 가장 일반적인 수학 기법인 ‘경사하강법(gradient descent)’도 생각해냈다. 레알은 “매우 놀라웠다”며 “이건 코드 여섯 줄 정도로 구성된 간단한 알고리즘이지만 정확하게 그 여섯 줄의 코드를 작성했다”고 말했다.

AutoML Zero는 아직 사람이 만든 시스템에 필적할 만큼의 구조를 생성하거나 인간 설계자는 하지 않았을 많은 작업을 하고 있지는 않다. 그러나 레알은 언젠가 시스템이 그런 일을 해낼 것이라고 믿는다.

새로운 ‘교사’를 양성할 시간

처음에 뇌를 만들었다면 그 후에는 뇌를 학습시켜야 한다. 그러나 기계 뇌는 우리가 하는 것처럼 학습하지 않는다. 우리 뇌는 새로운 환경과 작업에 적응하는 데 환상적인 능력을 가지고 있다. 오늘날의 AI는 특정 조건 하에서 문제를 해결할 수 있지만 그 조건이 조금이라도 바뀌면 문제 해결에 실패한다. 이렇게 유연하지 못하다는 특성이 다양한 시나리오에서 유용할 수 있는 ‘더 일반화된 AI’ 제작을 방해하고 있다. 다양한 시나리오에 유연한 모습을 보이는 AI를 만드는 것은 AI가 진정한 ‘지능’을 갖추게 하기 위한 커다란 단계일 것이다.

영국에 본사가 있는 딥마인드(DeepMind)의 연구원 제인 왕(Jane Wang)에게 AI를 더 유연하게 만드는 최고의 방법은 AI가 직접 유연성을 배우게 하는 것이다. 다시 말하면 왕은 특정 작업을 학습할 뿐만 아니라 새로운 상황에 적용할 수 있는 방식으로 그런 작업을 학습할 수 있는 방법을 학습하는 AI를 만들고자 한다.

연구원들은 적응력이 뛰어난 AI 제작을 위해 수년 동안 노력해왔다. 왕은 AI가 스스로 이 문제를 해결할 수 있게 하면 손으로 설계한 접근법의 일부 시행착오를 피할 수 있을 것이라고 생각한다. 왕은 “당장 올바른 답을 우연히 찾아낼 수 있으리라고 기대할 수는 없다”고 말했다. 왕은 AI가 직접 답을 찾도록 하는 과정에서 우리가 뇌의 작동방식에 관해 더 많이 배울 수 있기를 바란다. 그녀는 “사람이나 동물이 학습하는 방식에 관해서 아직 우리가 이해하지 못한 부분이 많다”고 말했다.

자동으로 학습 알고리즘을 생성하는 방식에는 두 가지 주요 접근법이 있다. 그러나 두 방법 모두 기존 신경망에서 출발하여 학습에 AI를 사용하는 방식이다.

딥마인드의 왕을 비롯한 연구팀오픈AI의 연구팀에서 거의 동시에 각각 고안한 첫 번째 접근법은 ‘순환신경망(recurrent neural network)’을 사용한다. 순환신경망은 생물의 뇌에서 뉴런이 발화하는 것과 유사하게 뉴런의 활성화가 알고리즘을 인코딩하는 방식으로 학습할 수 있다. 딥마인드와 오픈AI는 순환신경망을 학습시켜서 주어진 목표를 달성하기 위해 어떻게 행동해야 하는지 AI에게 알려주는 ‘강화학습(reinforcement-learning)’ 알고리즘을 생성했다.

결론적으로 딥마인드와 오픈AI 시스템은 이미지를 인식하는 것과 같은 특정 과제를 해결하는 알고리즘을 학습시키는 것이 아니라 다양한 작업에 적용할 수 있는 ‘학습’ 알고리즘을 학습시키는 것이다. 이는 마치 ‘물고기 잡는 법을 가르치라’는 오랜 격언과 같다. 손으로 설계한 알고리즘은 특정 작업을 학습할 수 있지만 딥마인드와 오픈AI가 개발하고 있는 것과 같은 AI들은 스스로 학습하는 법을 배우기 위해 만들어지고 있다. 그리고 그중 일부는 사람이 만든 AI보다 더 나은 성능을 보여준다.

두 번째 접근법은 캘리포니아대학교의 첼시 핀(Chelsea Finn)과 그녀의 동료 연구원들에게서 탄생했다. ‘MAML(model-agnostic meta-learning)’이라고 불리는 이 방식은 하나가 다른 것 안에 내장되어 있는 두 개의 머신러닝을 사용해서 모델을 학습시킨다.

대략적으로 말해서 이 방식은 다음과 같다. MAML의 내부 프로세스는 다른 것들처럼 데이터를 이용해 학습하고 테스트된다. 그러나 그렇게 내부 모델이 학습을 하고 나면 외부 모델이 내부 모델의 성능(예를 들어 이미지 인식 능력)을 평가하면서 성능 향상을 위해 모델의 학습 알고리즘을 어떻게 조정해야 하는지 학습한다. 이는 마치 학교 감독관이 각각 다른 학습 기법을 제공하는 여러 교사를 감독하는 것과 같다. 학생들이 최고의 점수를 얻는 데 어떤 학습 기법이 가장 도움이 됐는지 감독관이 확인하고 결과에 따라 학습 기법을 조정하는 것이다.

이 접근법을 통해 연구들은 더 강력하고 더 일반적이며 더 적은 데이터로 더 빠르게 학습할 수 있는 AI를 만들고 있다. 예를 들어 핀은 평지에서 걷는 법을 배운 로봇이 최소한의 추가 학습을 통해서 경사면이나 잔디밭을 걷거나 또는 짐을 들고 걸을 수 있게 되기를 바란다.

지난해 클룬과 동료들은 핀의 기술을 확장하여 알고리즘이 이전에 배웠던 것을 덮어쓰지 않도록 더 적은 뉴런으로 학습하는 알고리즘을 설계했다. 기존에 배운 것을 덮어쓰는 것은 머신러닝에서 아직 해결되지 않은 큰 문제이며 ‘치명적 망각(catastrophic forgetting)’이라고 알려져 있다. ‘희소(sparse)’ 모델, 즉 학습할 때 뉴런을 더 적게 사용하는 모델은 학습 후에 미사용 뉴런을 더 많이 남길 것이므로 다음에 다시 학습할 때 이러한 미사용 뉴런들을 새로운 작업에 사용할 수 있을 것이다. 새로운 작업에 사용할 미사용 뉴런이 많으면 이미 ‘사용된’ 뉴런 중에서 덮어쓰여지는 뉴런의 수가 줄어들 것이므로 치명적 망각을 예방할 수 있다. 클룬은 자신의 AI에 두 가지 이상의 작업을 학습하게 설정했을 때 AI가 사람이 설계한 것보다 성능이 좋은, 자체적인 ‘희소 모델’을 만들어낸 것을 발견했다.

만약 우리가 스스로 만들고 학습하는 AI 제작에 전력을 기울고 있다면 AI는 학교, 교과서, 수업 계획 등 자체적인 학습 환경을 생성해야 할 것이다.

그리고 최근에는 실제로 AI가 자동으로 생성되는 데이터로 학습하는 수많은 프로젝트가 등장했다. 예를 들어 얼굴인식(face-recognition) 시스템은 AI로 생성된 얼굴 이미지들로 학습하고 있다. AI는 또한 서로를 학습시키는 법도 배우고 있다. 최근의 한 사례에서는 더 어려운 블록 쌓기 과제 설정법을 배운 로봇 팔 하나가 다른 팔이 물체를 붙잡고 있도록 학습시키면서 두 로봇 팔이 협력하기도 했다.

사실 클룬은 인공지능이 학습하기 위해 어떤 데이터가 필요한지에 관한 인간의 직관이 어긋날 수 있는지 궁금해하고 있다. 예를 들어 그와 그의 동료들은 그가 생성적교수망(generative teaching network)이라고 부르는 신경망을 개발했다. 이 신경망은 모델을 학습시킬 때 최고의 결과를 얻기 위해서 어떤 데이터를 생성해야 하는지 학습한다. 한 실험에서 그는 이 신경망을 사용해서 이미지 생성 알고리즘을 학습시킬 때 자주 사용되는 ‘수기 숫자 데이터 세트’를 생성하기로 했다. 신경망이 고안한 방법은 기존에 사람이 만든 데이터 세트와 매우 달라 보였다. 예를 들어 숫자 7의 절반 위쪽처럼 보이는 부분과 2처럼 보이는 숫자의 아랫부분이 서로 합쳐져 있는 등 그다지 숫자처럼 보이지 않는 수백 개의 데이터들이 만들어졌다. AI가 생성한 일부 그림들은 아예 해독할 수도 없었다. 그런데도 AI가 생성한 이 ‘이상한’ 데이터는 필기 인식 시스템이 실제 숫자를 식별할 수 있도록 학습시키는 데 여전히 훌륭한 역할을 할 수 있었다.

성공하려고 하지 말 것

AI가 생성한 데이터는 여전히 퍼즐의 일부일 뿐이다. 장기적인 비전은 아직 발명되지 않은 기술들까지 모든 기술을 종합하여 인공두뇌가 연결되는 방법과 인공두뇌 학습법, 그리고 인공두뇌의 학습 자료를 제어하는 ‘AI 트레이너’에게 넘겨주는 것이다. 심지어 클룬조차도 그런 미래의 시스템이 어떤 모습일지 확신하지 못한다. 때때로 그는 초현실적으로 시뮬레이션된 일종의 샌드박스(sandbox)에 관해 이야기하곤 한다. 그것은 AI가 경험을 쌓고 넘어져서 가상 무릎에 상처도 날 수 있는 공간이다. 물론 그렇게 복잡한 무언가를 개발하려면 아직 몇 년은 더 걸릴 것이다. 현재 거기에 가장 근접한 것은 클룬이 우버의 루이 왕을 비롯한 다른 동료들과 함께 만든 POET이다.

왕은 POET을 만들 때 역설(paradox)에서 아이디어를 얻었다고 말했다. 그 역설이란 ‘문제를 해결하고자 하면 실패할 것이고 해결하려고 하지 않으면 성공할 가능성이 더 크다’는 것이다. 이는 클룬이 진화 과정에 대해 유추하면서 얻게 된 통찰 중 하나이다. 즉 놀라운 결과는 겉보기에 무작위적인 과정에서 나오며 같은 결과를 얻으려고 해도 그러한 과정은 의도적으로는 재창조될 수 없다. 나비가 존재하는 것은 분명하지만 나비의 단세포 전구체로 되돌아가서 박테리아부터 곤충이 되기까지 진화의 모든 단계를 모방하여 처음부터 나비를 만들려고 하면 실패할 가능성이 크다.

POET은 장애물이 없는 평평한 길 같은 단순한 환경에서 두 다리를 가진 AI 에이전트로 시작한다. 처음에 에이전트는 다리로 무엇을 해야 할지 모르며 걷는 법도 알 수 없다. 그러나 시행착오를 통해 에이전트를 제어하는 강화학습 알고리즘은 평지에서 걷는 법을 학습한다. POET은 그러고 나서 무작위로 다른 새로운 환경을 생성한다. 하지만 이동하기에 너무 어려운 환경은 아니다. 에이전트는 거기서도 걷기를 시도한다. 만약 새 환경에 장애물이 있다면 에이전트는 장애물을 넘어가거나 가로지르는 법을 배운다. 에이전트가 성공하거나 막힐 때마다 새로운 환경으로 넘어간다. 시간이 지나면 에이전트는 걷고 뛰는 다양한 동작을 배우면서 더 어려운 장애물이 있는 코스도 헤쳐나갈 수 있게 된다.

연구팀은 여기서 ‘무작위 환경 변화’가 필수적이라는 것을 발견했다.

예를 들어 에이전트는 때때로 평지에서 무릎을 이상하게 반쯤 접고는 느릿느릿 걷는 법을 배우기도 했다. 그렇게 걸어도 충분했기 때문이다. 왕은 “일어설 필요가 없으니 일어나는 법을 배우지 않는다”고 설명했다. 그러나 장애물이 흩뿌려진 땅을 지나가는 법을 학습해야 하는 상황이 되자 에이전트는 다시 초기 단계로 되돌아가서, 예를 들어 다리 한쪽을 끄는 대신에 두 다리를 다 사용해서 걷는 법 등 걷기 위한 더 나은 방법을 학습한 후에 어려운 문제를 해결했다.

POET은 인간이 하지 않는 방식으로 봇을 학습시킨다. 성공하기 위한 불규칙하고 직관적이지 않은 길을 택하는 것이다. 각 단계에서 봇은 직면한 모든 문제에 대한 해결책을 찾으려고 노력한다. 무작위로 마주한 장애물에 대처하면서 봇들은 점점 성능이 나아진다. 그러나 이 과정에는 종착점이 없으며 합격해야 하는 궁극적인 시험이나 넘겨야 하는 점수 기준도 없다.

클룬과 왕을 비롯한 연구원들은 이것이 ‘심오한 통찰’이라고 믿는다. 이들은 현재 ‘매우 똑똑한’ 기계 개발에 이 과정이 어떤 의미가 있을지 탐구하고 있다. 특정 경로를 계획하지 않으려는 시도가 인공일반지능으로 향하는 핵심 돌파구가 될 수 있을까?

POET은 이미 캘리포니아대학교의 나타샤 자크스(Natasha Jaques)와 마이클 데니스(Michael Dennis) 같은 다른 연구원들에게 영감을 주고 있다. 그들은 AI를 사용해서 다른 AI가 탐색할 수 있는 미로를 생성하는 PAIRED라는 시스템을 개발했다.

루이 왕은 인간이 설계한 도전은 장애물이 될 것이며 AI의 진정한 진보는 AI가 스스로 생각해야 할 것이라고 생각한다. 그는 “현재 알고리즘이 아무리 뛰어나더라도 그것들은 손으로 설계한 기준을 바탕으로 테스트된다”며 “거기에는 고정된 목표가 있기 때문에 여기서 인공일반지능이 탄생하리라고 상상하기는 어렵다”고 말했다.

새로운 종류의 지능

스스로 학습할 수 있는 AI의 급속한 발전은 우리가 AI의 성장을 얼마나 잘 통제할 수 있는지에 대한 의문을 제기하기도 한다. ‘더 나은 AI를 구축하는 AI’라는 아이디어는 ‘특이점(Singularity)’ 뒤에 숨겨진 믿음을 형성하는 중요한 부분이다. 특이점이란 AI가 기하급수적인 속도로 성능이 향상되기 시작하고 우리의 통제를 벗어나는 미래의 어떤 시점을 의미한다. 결국 일부 비관론자들은 AI가 인간이 전혀 필요하지 않다고 결정할 수도 있다고 경고한다.

그러나 그런 것은 이 연구원들 중 누구도 염두에 두고 있지 않은 생각이다. 이들의 연구는 현재의 AI를 더 나은 버전으로 만드는 데 집중되어 있다. 이상한 생각을 하는 기계는 여전히 아득히 먼 미래의 상상에 지나지 않는다.

그렇다고 해도 딥마인드의 제인 왕은 의구심을 가지고 있다. AI를 사용해서 AI를 만드는 것의 매력 중 큰 부분은 이것이 사람이 생각하지 못하는 설계와 기술을 고안해낼 수 있다는 것이다. 그러나 왕은 모든 놀라움이 꼭 ‘좋은’ 놀라움은 아니라고 지적한다. 그녀는 “정의상 ‘개방’이라는 것은 예상치 못한 무언가를 말한다”고 지적했다. AI가 예상하지 못했던 무언가를 하게 만드는 것이 아이디어의 전부라면 통제하기 더 어려울 것이다. 그녀는 “그건 흥미롭기도 하고 무섭기도 하다”고 말했다.

클룬은 처음부터 새로운 기술의 윤리에 관해 생각하는 것이 중요하다고 강조했다. AI가 설계한 신경망과 알고리즘은 현재의 이미 불투명한 ‘블랙박스’ 시스템보다 더 이해하기 어려울 가능성이 크다. 알고리즘에 의해 생성된 AI에서 편향을 검사하기가 더 어려울까? 그런 AI들이 바람직하지 않은 방식으로 행동하지 않을 것이라고 장담하는 것이 더 어려울까?

클룬은 더 많은 사람들이 스스로 생성하는 AI의 잠재력을 깨닫고 있으므로 서로 그런 질문을 던지며 답을 공유하기를 바란다. 그는 “머신러닝 학계의 대부분의 사람들은 극도로 강력한 AI를 향해가는 우리의 전반적인 경로에 관해서는 실제로 대화하지 않는다”고 설명했다. 대신에 그들은 작고 점진적인 개선점에 집중하는 경향이 있다. 클룬은 AI 분야의 가장 큰 야심에 대해 다시 대화를 개시하고 싶어 한다.

그의 야심은 인간의 지능과 인간 지능의 진화 과정에 대한 그의 관심과 관련되어 있다. 그의 대담한 비전은 언젠가 기계가 자신들의 ‘지능’이 탄생해서 궁극적인 목표나 계획을 염두에 두지 않은 알고리즘의 안내에 따라 셀 수 없는 시행착오를 거쳐 개선되는 과정을 목격하게 하는 것이다.

AI가 스스로 지능을 생성하기 시작한다면 그것이 인간의 지능과 비슷하리라는 보장은 없다. 인간이 기계에게 사람처럼 생각하라고 가르치는 대신에 기계가 인간에게 새로운 사고법을 가르칠지도 모른다.

클룬은 “매우 ‘똑똑’해지는 것에는 다양한 방법이 있을 것”이라며 “AI에 관해서 나를 흥분시키는 것 중 하나는 우리가 어떤 변화가 가능한지 목격하면서 지능을 더 일반적으로 이해할 수 있게 될 것이라는 점”이라고 말했다.

그는 마지막으로 이렇게 말했다. “나는 그것이 매혹적이라고 생각한다. 이는 마치 우주를 여행하는 법을 개발해서 외계 문명에 방문하는 것과 비슷하다. 인류 역사에서 외계인을 만나고 그들의 문화, 과학 등 모든 것을 배우는 것만큼 위대한 순간은 없을 것이다. 우주 여행은 매우 어렵지만 우리에게는 언젠가 그런 외계 지능을 디지털로 만들어낼 수 있는 능력이 있다.”

미리보기 2회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.