AI is learning how to create itself

인공지능을 창조하는 인공지능

사람들은 그 동안 정말 똑똑한 기계를 개발하기 위해 노력해왔다. 그러나 어쩌면 우리는 AI가 스스로 발전해 나가도록 할 필요가 있을지도 모른다.

쐐기 모양의 작은 막대기가 화면을 지나간다. 막대기는 반쯤 구부린 상태로, 한쪽 무릎을 땅에 끈다. 막대기가 걸어간다! 그렇다. 루이 왕(Rui Wang)은 기뻐하며 다음과 같이 말했다. “매일 사무실로 가서 컴퓨터를 여는데, 어떤 장면이 펼쳐질 지 기대된다.”

우버(Uber)의 인공지능 연구원인 루이 왕은 개발에 참여한 소프트웨어인 POET (Paired Open-End Trailblazer)이 밤새도록 노트북에서 실행되게 둔다. POET은 가상 봇(Virtual Bot)을 위한 일종의 훈련장이다. 가상 봇은 아직까지는 많은 과제를 학습하지 않고 있다. 이 AI 요원은 바둑을 두거나, 암 징후를 포착하거나, 단백질 접힘(Protein Folding)을 하지 않는다. 가상 봇은 넘어지지 않고 담장과 골짜기가 나오는 단순한 만화 풍경을 지나간다.

흥미로운 점은 가상 봇이 학습하는 내용이 아니라 학습하는 방식에 있다. POET은 장애물 코스를 만들고, 가상 봇의 능력을 평가하며, 다음 수행할 도전과제를 정한다. 이 모든 과정에는 사람의 개입이 없다. 발걸음이 비틀거리기는 하지만, 가상 봇은 시행착오를 통해 발전한다. 왕은 “언젠가는 가상 봇이 마치 쿵푸 대가처럼 절벽을 넘을 수도 있다”고 주장한다.

지금으로서는 기초 단계처럼 보일지 모른다. 그러나 왕과 일부 연구원들에게 POET은 AI가 스스로 발전하도록 함으로써 아주 똑똑한 기계 개발을 위한 혁신적인 방법을 보여준다.

왕의 전 동료인 제프 클룬(Jeff Clune)은 이 아이디어를 열렬히 지지하는 사람 중 한 명이다. 클룬은 처음에는 와이오밍대학교에서, 그 다음에는 우버 AI 연구소(Uber AI Lab)에서 왕 및 다른 연구원과 수년간 연구를 진행해왔다. 현재는 브리티시컬럼비아대학교와 오픈AI(OpenAI)를 오가며, 세계 최고 AI 연구소의 지원을 받고 있다.

클룬은 진짜 똑똑한 AI를 개발하려는 시도를 인류 역사상 가장 야심찬 과학적 도전이라고 부른다. AI를 개발하기 위한 진지한 노력이 시작된 지도 70년이 지났다. 그러나 사람보다 더 똑똑하기는 커녕 비슷한 수준이라도 되는 기계를 만들려면 아직도 갈 길이 멀다. 클룬은 POET이 지름길이 될 수 있다고 생각한다.

그는 “틀을 깨고 우리가 고수해 온 방식을 벗어나야 한다”고 지적한다.

클룬의 주장이 옳다면, AI를 이용해서 AI를 만들 경우 인간을 능가할 수 있는 기계인 인공일반지능(Artificial General Intelligence, AGI)으로 가는 과정에서 중요한 발걸음이 될 수 있다. 단기적으로, AI를 이용해 AI를 만드는 기술은 다른 종류의 지능을 발견하도록 도와준다. 여기서 다른 종류의 지능이란 예상치 못한 방식으로 해결책을 찾을 수 있고, 지능을 대체하기보다는 보완할 수 있는 비인간적 스마트 머신(Non-Human Smart)을 지칭한다.

진화 모방

MIT 테크놀로지 리뷰는 작년 초 클룬과 처음 이 아이디어에 대해 이야기를 나눴다. 클룬이 오픈AI로 옮긴 지 불과 몇 주가 지난 뒤였다. 그는 예전에 한 연구에 대해서 의견을 나누기는 좋아했지만, 새 팀과 진행중인 연구에 대해서는 입을 굳게 다물었다. 그는 사무실 안에서는 전화를 받지 않았고, 대화를 나누는 동안 사무실 밖 거리를 왔다 갔다 했다.

클룬이 했던 말은 오픈AI와 잘 맞는다는 것이 전부였다. 그는 “오픈AI와 생각이 아주 잘 통한다”고 주장했다. “천생연분인 것 같다. 오픈AI는 내 연구의 비전을 마음에 들어했고, 이 회사로 와서 이를 실행해 주기 바랬다.” 클룬이 합류하고 몇 달 후, 오픈AI는 클룬과 같이 일했던 우버 팀원도 대부분 채용했다.

클룬의 야심찬 계획은 오픈AI의 투자 외에도 더 많은 것을 바탕으로 한다. AI의 역사는 인간이 설계한 솔루션이 머신러닝 솔루션에 자리를 내준 사례로 가득하다. 컴퓨터 비전을 예로 들어보자. 10년 전, 이미지 인식(Image Recognition)은 기존의 수작업 시스템이 처음부터 스스로 학습한 시스템으로 대체되었을 때 크게 발전했다. 많은 AI 성공 사례도 마찬가지이다.

AI, 특히 머신러닝의 흥미로운 점은 인간이 찾지 못한 해결책을 찾는 능력인데, 이런 능력은 우리를 놀라게 한다. 자주 인용되는 사례로 알파고(AlphaGo)와 후속 버전인 알파제로(AlphaZero)가 있다. 알파고는 외계인 같은 전략을 구사하여 바둑이라는 오래된 게임에서 최고의 인간 고수를 이겼다. 인간 고수들이 오랜 기간 연구한 끝에, AI는 누구도 생각하지 못했던 해결책을 찾아냈다.

클룬은 2018년 가상 환경에서 숨바꼭질을 배운 봇을 개발한 오픈AI팀과 연구를 진행 중이다. 이 AI는 단순한 목표와 목표 달성을 위한 간단한 도구로 시작되었다. 한 쌍의 AI는 움직이는 장애물 뒤에 숨은 다른 한 쌍을 찾아야 했다. AI가 학습에 투입되었을 때, AI는 연구원들이 예측하지 못했던 방식으로 환경을 이용하는 방법을 즉시 터득했다. AI는 가상의 시뮬레이션된 물리학적 결함을 활용하여 벽을 뛰어넘고 통과하기까지 했다.

이러한 종류의 예상치 못한 창발적 행동(Emergent Behavior)은 AI가 인간이 스스로는 생각하지 못할 기술적 해결책에 도달할 수 있음을 어렴풋이 시사한다. 또한, 새롭고 더 효율적인 유형의 알고리즘이나 신경망을 개발하거나, 심지어 현대 AI의 초석인 신경망을 완전히 버릴 수도 있다는 점을 암시하기도 한다.

클룬은 사람들에게 지능은 이미 단순한 시작 단계를 벗어났다는 점을 상기시키고 싶어한다. 그는 “우리가 이 접근 방식이 효과가 있음을 알고 있다는 점이 흥미롭다”고 말한다. “뇌는 지금까지 이 세상에서 가장 지능이 뛰어난 학습 알고리즘이다” 클룬의 요점은 다음과 같다. 우리가 알고 있는 지능이 수 세대에 걸쳐 유전자의 무분별한 돌연변이로 인해 발생했다면, 왜 지능 그 자체보다는 더 간단한 지능 생성이라는 과정을 복제하려고 하지 않는가.

하지만 여기 또 다른 중요한 발견이 있다. 지능은 결코 진화의 끝, 목표로 삼아야 할 어떤 대상이 아니었다. 대신, 지능은 생물체가 환경의 갖가지 문제에 맞서 생존하고 다음 도전을 하기 위해 찾아낸 여러 형태의 작은 해결책들에서 나타났다. 지능은 현재 진행 중이면서 개방형 프로세스 중 가장 중요한 요소이다. 이러한 의미에서, 진화는 사람들이 일반적으로 생각하는 알고리즘과 상당히 다르다. 사람들은 알고리즘을 목적을 위한 수단으로 흔히 생각하지만, 진화는 그렇지 않다.

클룬과 연구원들은 이런 개방적인 방식이 새로운 종류의 AI로 이어질 수 있다고 믿는다. 개방성(Open-endedness)은 POET에 의해 생성된 목표 없는 도전의 연속에서 드러난다. 수십 년 동안 AI 연구원들은 인간의 지능을 모방하기 위한 알고리즘을 구축하려고 노력했다. 그러나 1) 진화의 개방적인 문제 해결 방식을 모방하려는 알고리즘을 구축할 때와 2) 무엇이 나타나는지 지켜볼 때 진정한 도약이 이루어질 수 있다.

연구원들은 이미 머신러닝을 스스로 사용하여, 이 분야의 가장 어려운 문제에 대한 해결책을 모색하는 훈련을 하고 있다. 여기에는 동시에 여러 과제를 학습할 수 있는 기계를 개발하는 방법이나 이전에 접하지 못했던 상황에 대처하는 방법 등이 있다. 어떤 사람들은 이러한 접근 방식을 택하고 사용하면 AGI에 도달하는 최선의 길이 될 수 있다고 생각한다. 클룬은 “처음에는 지능이 높지 않은 알고리즘으로 시작해서, 마침내는 AGI에 이르게 될 것이다”라고 주장한다.

현재 AGI는 여전히 환상에 불과한데, 누구도 AGI를 개발하는 방법을 모르기 때문이다. AI 발전은 점차적으로 이루어지며 사람에 의해 수행된다. 일반적으로 사람들이 기존의 기술이나 알고리즘에 변경을 가하면, AI의 성능이나 정확도는 점진적으로 향상된다. 클룬은 이러한 노력을 여러분이 무엇을 찾거나 몇 개의 구성 요소가 필요할지 모르는 상태에서 인공지능을 위한 기본 토대를 발견하려는 시도라고 규정한다. 그것은 시작에 불과하다. 그는 “언젠가 우리는 필요한 요소를 하나로 연결하는 막중한 임무를 수행해야 한다”고 말한다.

AI에게 이러한 구성 요소를 찾아 조립하도록 요구하려면 패러다임의 전환이 필요하다. 우리는 지능형 기계를 만들고 싶다고 하지만, 기계의 외형은 상관하지 않고 작동되는 것은 무엇이든지 보고 싶어한다.

비록 AGI가 결코 달성되지 않더라도, 자가학습 방식은 여전히 어떤 종류의 AI가 만들어지는지를 바꿀 수 있다. 클룬은 세상은 뛰어난 바둑 선수 외에도 더 많은 것을 원한다고 주장한다. 클룬의 관점에서, 아주 똑똑한 기계를 만든다는 것은 기계 스스로 도전 과제를 정하고, 해결한 다음, 다시 새로운 도전과제를 정하는 시스템 구축을 의미한다. POET이 이런 과정을 대략적으로 보여준다. 클룬은 가상 봇에게 걷고, 돌차기놀이(Hopscotch)를 하며, 바둑 두는 법을 가르치는 기계를 떠올려본다. 그는 이렇게 설명한다. “그 다음에는 수학 문제를 배우고 스스로 도전과제를 정하기 시작할 것이다. 시스템은 끊임없이 발전하여, 한계가 어디까지 일지는 그 누구도 예상할 수 없다.”

이런 추측이 터무니 없다고 생각할 수도 있다. 그러나 이런 기계를 통해 상상 속의 막다른 골목에서 벗어나서 기후변화나 세계 보건 이슈 같은 엄청나게 복잡한 위기를 극복할 수 있기를 바란다.

그렇게 되려면 먼저 하나라도 만들어야 한다.

뇌를 어떻게 만들 것인가

인공 뇌를 연결하는 방법은 많다.

신경망은 소프트웨어로 인코딩된 여러 층의 인공 뉴런으로 만들어진다. 각각의 뉴런은 위 층의 다른 뉴런과 연결이 가능하다. 신경망을 연결하는 방법에 따라 큰 차이가 발생하고, 새로운 아키텍처는 종종 새로운 도약으로 이어진다.

인간 과학자들이 코딩한 신경망은 시행착오의 결과물일 경우가 많다. 무엇이 효과가 있고 무엇이 효과가 없는지에 대한 이론이 거의 없으며, 최고의 디자인이 발견되었다는 보장도 없다. 그렇기 때문에 더 훌륭한 신경망 설계를 목표로 탐색을 자동화하는 것이 적어도 1980년대 이후 AI 분야에서 최대 관심사 중 하나였다. 프로세스를 자동화하는 가장 일반적인 방법은 AI가 가능한 많은 네트워크 설계를 생성하도록 하는 것이다. 또한, 네트워크가 각각의 설계를 자동으로 시도하고 가장 적합한 설계를 선택하도록 하는 방법도 있다. 이 방법을 일반적으로 신경 진화(Neuro-evolution) 또는 신경 아키텍처 검색(Neural Architecture Search, NAS)이라고 한다.

몇 년 동안, 이러한 기계 설계는 인간의 설계를 능가하기 시작했다. 2018년, 에스테반 레알(Esteban Real)과 구글 동료들은 NAS를 사용하여 당시 인간이 설계한 최고의 네트워크를 능가하는 이미지 인식 신경망을 생성했다. 연구 결과는 가히 획기적이었다.

2018년 시스템은 오토ML(AutoML)이라는 현재 진행 중인 구글 프로젝트의 일환이다. 이 프로젝트는 또한 NAS를 사용하여 사람이 설계한 모델보다 더 효율적인 딥러닝 모델 제품군인 이피션트넷(EfficientNet)을 생성하였다. 이로써 더 작고 더 빠른 모델로 이미지 인식 작업에서 높은 정확도를 달성했다.

3년이 지난 지금 레알은 처음부터 생성될 수 있는 결과물의 경계를 넓히고 있다. 이전의 시스템은 기존 유형의 층이나 구성요소 같은 검증된 신경망 조각을 재배열할 뿐이었다. 그는 “좋은 결과를 기대한다”고 밝혔다.

작년에 레알과 연구팀은 훈련을 멈추고 본격적인 작업에 들어갔다. 오토ML 제로(AutoML Zero)라는 새로운 시스템은 머신러닝을 지배하는 가장 기본적인 수학 개념만을 사용하여 처음부터 AI를 구축하려고 한다.

놀랍게도 오토ML 제로는 자발적으로 신경망을 구축했다. 또한, 인간 설계자들이 네트워크 훈련에 사용하는 가장 일반적인 수학 공식인 경사 하강법(Gradient Descent)을 찾아냈다. 레알은 여기에 대해 다음과 같이 설명했다. “나는 깜짝 놀랐다. 이것은 코드 6줄 같은 아주 간단한 알고리즘이지만, 정확히 6줄을 썼다.”

오토ML 제로는 아직 인간이 설계한 시스템의 성능에 필적하는 아키텍처를 생성하지 않고 있다. 또한 실제로 인간 설계자가 하지 않았을 일을 많이 못하고 있다. 그러나 레알은 언젠가는 가능하리라고 믿는다.

새로운 유형의 선생을 훈련시킬 시간

먼저 뇌를 만들고, 뇌를 학습시켜야 한다. 하지만 기계의 두뇌는 사람과 같은 방식으로 배우지 않는다. 사람의 뇌는 새로운 환경과 과제에 아주 잘 적응한다. 오늘날의 AI는 어떤 상황에서는 도전을 해결할 수 있지만, 상황이 조금이라도 바뀌면 실패한다. 이렇게 융통성이 부족하기 때문에, 정말 똑똑한 AI를 개발하는데 큰 도움이 될 다양한 시나리오에서 유용할 수 있는 보다 일반화된 AI(Generalizable AI)를 개발하려는 시도가 방해를 받는다.

런던의 딥마인드(DeepMind) 연구원인 제인 왕(Jane Wang)의 입장에서, 유연한 사고가 가능한 AI를 만드는 가장 좋은 방법은 이런 특성 자체를 배우도록 하는 것이다. 즉, 그녀는 특정 업무를 학습할 뿐만 아니라 새로운 상황에 적응할 수 있는 방식으로 해당 과제를 학습하는 AI를 구축하고자 한다.

연구원들은 수년간 AI의 적응력을 높이기 위해 노력해왔다. 왕은 AI가 스스로 이 문제를 해결하도록 하면 손으로 설계된 방식의 시행착오를 일부 피할 수 있다고 생각한다. “우리는 지금 당장 정답을 우연히 발견할 것이라고 기대하지 않는다.” 이런 과정을 통해서, 그녀는 뇌의 작동 원리에 대해서도 우리가 더 많이 배울 수 있기를 바란다. 왕은 “인간과 동물이 학습하는 방식에 대해 우리가 모르는 부분이 여전히 너무 많다”고 주장한다.

학습 알고리즘을 자동으로 생성하는 방법은 크게 두 가지가 있다. 두 방법 모두 기존 신경망에서 시작하고 AI를 사용하여 학습한다.

왕과 딥마인드 동료 연구팀 및 오픈AI팀이 거의 동시에 별도로 고안한 첫 번째 접근법은 순환 신경망(Recurrent Neural Network, RNN)을 사용한다. 이러한 유형의 네트워크는 생물학적 뇌에서 뉴런의 발화(Firing)와 거의 유사한 뉴런의 활성화(Activation)가 모든 유형의 알고리즘을 인코딩하는 방식으로 훈련될 수 있다. 딥마인드와 오픈AI는 이를 이용해 순환 신경망을 훈련시켜서 강화학습 (Reinforcement Learning) 알고리즘을 생성했다. 강화학습 알고리즘은 정해진 목표 달성을 위해 행동하는 방법을 시스템에게 알려준다.

딥마인드와 오픈AI 시스템은 이미지 인식 등 특정 과제를 해결하는 알고리즘을 학습하지 않고, 여러 작업에 적용 가능한 학습 알고리즘을 터득해서 진행 상황에 맞게 적응한다. 마치 낚시하는 법 알려주기라는 옛 속담과 같다. 손으로 설계한 알고리즘이 특정 과제를 배울 수 있는 반면, 이 AI는 스스로 배우는 방법을 터득하도록 개발되고 있다. 그리고 이 AI 중 일부는 인간이 디자인한 모델보다 성능이 더 뛰어나다.

UC버클리의 첼시 핀(Chelsea Finn)과 동료 연구팀은 두 번째 접근 방법을 제시했다. 모델에 구애받지 않는 메타 학습(Model-Agnostic Meta-Learning, MAML)이라는 이 프로그램은 두 가지 머신러닝 프로세스를 사용하여 모델을 훈련하며, 한 프로세스가 다른 프로세스 안에 중첩된다.

작동 방식은 대략 다음과 같다. MAML의 내부 프로세스는 평소와 같이 데이터로 훈련된 후 테스트된다. 그러나 외부 모델은 내부 모델의 성능(예: 이미지를 얼마나 잘 식별하는지)을 사용하여 성능을 개선시키도록 모델의 학습 알고리즘을 조정하는 방법을 터득한다. 마치 장학사가 각기 다른 교육 방법을 제공하는 선생님들을 감시하는 것과 같다. 장학사는 어떤 방법을 통해 학생이 점수를 제일 잘 받을 수 있는지 확인하고 그에 따라 학습법을 수정한다.

연구원들은 이러한 방식을 통해 더 강력하고, 더 일반화되었으며, 더 적은 데이터로 빨리 학습할 수 있는 AI를 구축하고 있다. 예를 들면, 핀은 평지를 걷는 법을 배운 로봇이 최소한의 추가 훈련으로 경사로나 잔디 위를 걷거나 짐 나르기도 할 수 있기를 바란다.

지난해 클룬과 동료 연구진은 핀의 기술을 확장해 뉴런 수를 줄여 학습하는 알고리즘을 설계해서 이전에 학습한 모든 내용을 덮어쓰지(Overwriting) 않도록 했다. 덮어쓰기는 머신러닝에서 파국적 망각(Catastrophic Forgetting)으로 알려진 아직 해결하지 못한 커다란 문제이다. 더 적은 수의 뉴런을 사용하는 훈련된 모델은 ‘희소한(Sparse)’ 모델로 알려져 있다. 이 모델은 재훈련 시 새로운 작업에 전념하기 위해 남겨진 사용되지 않은 뉴런을 더 많이 보유하게 될 것이다. 이는 ‘사용된’ 뉴런 중 적은 수가 덮어 쓰이게 된다는 의미이다. 클룬은 본인의 AI를 한 가지 이상의 과제를 학습하도록 설정함으로써 인간이 설계한 모델보다 성능이 뛰어난 자체 희소 모델을 고안하게 되었다는 것을 알았다.

만약 AI가 스스로 만들고 가르칠 수 있도록 한다면, AI는 자신의 훈련 환경(학교, 교과서, 수업 계획)도 만들어야 한다.

지난 해에는 AI가 자동 생성 데이터로 훈련 받은 프로젝트가 많았다. 안면인식 시스템은 AI가 생성한 얼굴 사진으로 훈련 중이다. AI는 또한 서로 훈련시키는 방법을 배우고 있다. 최근, 두 개의 로봇 팔이 서로를 훈련시킨 사례가 있었다. 한 쪽 팔은 어려운 블록 쌓기를 배우면서, 다른 쪽 팔이 블록을 잡도록 훈련시켰다.

실제로 클룬은 AI가 학습하기 위해 어떤 종류의 데이터가 필요한 지에 대해 인간의 직관이 떨어지는지 궁금해한다. 클룬과 동료 연구팀은 모델 훈련 시 최상의 결과를 얻기 위해 어떤 데이터를 생성해야 하는지를 배우는 생성적 학습 네트워크(Generative Teaching Network)를 개발했다. 한 실험에서, 클룬은 이미지 인식 알고리즘 훈련에 종종 사용되는 손으로 쓴 숫자 데이터세트를 조정하기 위해 이러한 네트워크 중 하나를 사용했다. 인간이 큐레이션한 원래 데이터세트와는 매우 다르게 보인다. 숫자 7의 위쪽 절반이나 두 자리 숫자처럼 보이는 것 등 수백 개의 숫자가 합쳐졌다. AI가 생성한 사례 중 일부는 전혀 해독하기 어려웠다. 그럼에도 불구하고, AI가 생성한 데이터는 실제 숫자를 식별하는 필기 인식(Handwriting Recognition) 시스템을 훈련시키는 데 여전히 큰 역할을 했다.

성공하려고 하지 않기

AI가 생성한 데이터는 아직 풀리지 않는 부분이 있다. 장기적인 계획은 인공 뇌가 어떻게 연결되고, 어떻게 훈련되며, 무엇을 훈련시키는가를 제어하는 AI 트레이너에게 이 모든 기술(아직 발명되지 않은 기술도 있음)을 넘겨주는 것이다. 클룬도 미래 시스템이 어떨 지는 잘 모른다. 가끔 그는 AI가 가상의 경험을 쌓고 넘어지며 배우는 초현실적인 시뮬레이션 모래상자(Sandbox)에 대해 이야기한다. 복잡한 연구는 아직 몇 년이 더 걸릴 예정이다. 지금까지 가장 근접한 결과로는 클룬이 우버의 루이 왕 등과 함께 개발한 POET 시스템을 들 수 있다.

왕은 POET이 모순에 의해 동기가 부여됐다고 주장한다. 문제를 해결하려고 하면 실패할 것이고, 해결하지 않으려고 하면 성공할 가능성이 높다. 이것은 클룬이 진화론에서 유추하여 얻은 통찰 중 하나이다. 무작위적으로 보이는 과정에서 얻은 놀라운 결과는 똑같은 목적을 달성하기 위하여 의도적인 조치를 통해 다시 만들어낼 수 없다는 뜻이다. 나비가 존재한다는 사실에는 의심의 여지가 없지만, 단세포 전구체(Precursor)로 되돌아가서 박테리아에서 벌레가 되는 각각의 단계를 선택하여 처음부터 다시 만들려고 노력하면 실패하게 된다.

POET은 장애물이 없는 평지 같은 단순한 환경에서 이족(二足) 에이전트를 실행한다. 초반에 에이전트는 다리를 어떻게 해야 할지 모르고 걸을 수도 없다. 그러나 에이전트를 제어하는 강화학습 알고리즘은 시행착오를 통해 평지를 이동하는 방법을 배운다. 그런 다음 POET은 무작위로 새 환경을 만든다. 환경은 서로 다르기는 하지만, 이동하기가 꼭 어렵지는 않다. 에이전트는 그곳을 걸어보려고 한다. 새로운 환경에 장애물이 있을 경우, 에이전트는 장애물을 넘거나 건너는 법을 터득한다. 에이전트가 성공적으로 넘어가거나 막힐 때마다 새 환경으로 이동한다. 시간이 흐름에 따라 에이전트는 다양한 걷기와 점프 동작을 익혀서 더 어렵고 힘든 코스를 통과한다.

연구팀은 환경을 무작위로 전환하는 것이 중요하다는 사실을 깨달았다.

예를 들면, 에이전트는 이 정도면 괜찮다고 판단해서 가끔 이상하게 한쪽 무릎을 굽히고 평지를 걷는 법을 배웠다. 왕은 “에이전트가 그럴 필요가 없기 때문에 굳이 일어서는 법을 결코 배우지 않는다”고 주장한다. 그러나 장애물이 많은 곳에서 대체 가능한 전략을 터득하고 나면, 에이전트는 발달된 보행 방법(예: 한 쪽 다리를 끄는 대신 두 다리를 사용)을 통해 초기 단계로 되돌아갈 수 있었다. 그리고 나서, 더 어려운 도전을 하는 업그레이드 버전을 택할 수 있다.

POET은 인간이 할 수 없는 방식으로 봇을 훈련시킨다. POET은 불규칙하고 까다로운 경로를 택해서 임무를 성공적으로 수행한다. 각 단계에서 봇은 주어진 과제는 무엇이든지 해결책을 찾으려고 한다. 아무렇게나 던져진 장애물에 대처함으로써, 봇은 전반적으로 성능이 더 개선된다. 그러나 이 과정은 끝도 없고, 통과해야 할 최종 테스트도 없으며, 갱신해야 할 높은 점수도 없다.

클룬, 왕, 여러 동료 연구원들은 이 과정을 심오한 통찰력이라고 생각한다. 그들은 지금 심오한 통찰력이 훨씬 똑똑한 기계의 발전에 어떤 의미가 있는지 탐구 중이다. 특정 경로를 도표화하지 않는 것이 실제로 AGI에 이르는 과정에서 중요한 돌파구가 될 수 있을까?

POET은 이미 UC버클리의 나타샤 잭스(Natasha Jaques)와 마이클 데니스(Michael Dennis) 같은 다른 연구원들에게 영감을 주고 있다. 그들은 AI를 이용해 일련의 미로를 만들어서 다른 AI가 미로를 통과하도록 훈련시키는 PAIRED라는 시스템을 개발했다.

루이 왕은 사람이 설계한 도전이 장애물이 될 것이며, AI의 진정한 발전을 위해서는 AI가 스스로 고안해야 한다고 생각한다. 그는 “오늘날의 알고리즘이 아무리 훌륭하더라도, 알고리즘은 항상 손으로 설계한 기준으로 테스트된다”고 지적한다. “AGI가 고정된 목표에 얽매여 있기 때문에, 여기에서 나오는 AGI를 상상하기는 매우 어렵다.”

새로운 종류의 지능

자가훈련이 가능한 AI가 빠르게 성장하는 것도 우리가 AI의 발전을 얼마나 잘 제어할 수 있을지 의문을 제기한다. 더 나은 AI를 구축하는 AI라는 개념은 ‘싱귤래리티(Singularity)’ 뒤에 숨겨진 신화 만들기에서 중요한 부분이다. 싱귤래리티는 AI가 비약적으로 발전하여 인간의 통제를 벗어나기 시작하는 상상 속의 시점을 의미한다. 어떤 예언가들은 결국 AI가 인간이 전혀 필요하지 않다고 판단할 수도 있다고 경고한다.

연구원 중 어느 누구도 이런 경고를 염두에 두고 있지 않다. 연구원들은 AI 업그레이드에 상당히 중점을 두고 있다. 기계가 인간의 통제를 벗어나 날뛰는 모습은 아직 아득한 환상에 불과하다.

그럼에도 불구하고 딥마인드의 제인 왕은 유보적인 입장을 취한다. AI를 활용해 AI를 만드는 매력 중 큰 부분은 사람들이 미처 생각하지 못했던 디자인과 기술을 생각해낼 수 있다는 점이다. 그러나 왕은 깜짝 놀랄만한 결과라고 해서 반드시 꼭 좋지만은 않다고 주장한다. “개방적이라 함은 의미상 예기치 않았다는 뜻이다.” 만약 AI가 여러분이 예상치 못했던 일을 하도록 하는 것이 목적이라면, 통제하기가 어려워진다. 그녀는 “흥미롭기도 하지만 두렵기도 하다”고 입장을 표명한다.

클룬은 또한 처음부터 새로운 기술의 윤리적인 면을 고려하는 것이 중요하다고 강조한다. AI가 설계한 신경망과 알고리즘은 오늘날 이미 불투명한 블랙박스(Black Box) 시스템보다 더 이해하기 어려울 가능성이 크다. 알고리즘으로 생성된 AI는 편향을 감시하기 더 어려운가? 이 AI가 바람직하지 않은 방식으로 행동하지 않을 것이라고 장담하기가 더 어려운가?

클룬은 더 많은 사람들이 자가생성 AI의 잠재력을 알기 때문에 위와 같은 질문을 던지고 대답을 얻기를 바란다. “머신러닝 업계 사람들은 대부분 매우 강력한 AI로 향하는 전반적인 경로에 대해 이야기하지 않는다.” 사람들은 대신 소규모의 점진적인 개선에 초점을 맞추는 경향이 있다. 클룬은 AI 분야의 가장 원대한 계획에 대해 다시 대화를 시작하고 싶어한다.

클룬의 계획은 인간 지능에 보였던 초기 관심과 인간 지능이 어떻게 발전했는지를 다시 연결시켜준다. 그의 원대한 꿈은 궁극적인 계획 없이 알고리즘이 생성한 수많은 시행착오를 통해 기계 지능이 개선되는 모습을 보는 것이다.

인공지능이 스스로 지능을 생성한다면 인간의 지능과 비슷하리라는 보장이 없다. 인간이 인간처럼 생각하도록 기계를 가르치기 보다, 기계가 인간에게 새로운 사고방식을 가르칠 지도 모른다.

클룬은 똑똑해지는 데는 아마 수많은 방법이 있을 것이라고 주장한다. “어떤 변화가 가능한지를 보고, 지능을 더 일반적으로 이해하게 될 수도 있다는 점이 흥미를 유발한다.”

“정말 신기하다. 마치 별나라 여행을 개발하고 외계 문화를 체험하는 것 같다. 인류 역사상, 외계인과 조우하고 외계인의 문화, 과학, 모두를 배우는 일보다 더 위대한 순간은 없을 것이다. 별나라 여행을 하기는 매우 어렵지만, 우리에게는 디지털로 외계 지능을 창조할 수 있는 잠재력이 있다.”

미리보기 3회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.