I Was There When: AI helped create a vaccine

팟캐스트: AI가 코로나19 백신 개발을 도왔다

인공지능 및 컴퓨팅 분야에서의 혁신이 어떻게 이루어졌는지, 그 현장에 있던 사람들의 이야기를 직접 들어보는 코너 입니다. 이번 시간에는 모더나(Moderna)의 데이터 및 인공지능 분야 최고책임자 데이브 존슨(Dave Johnson)을 만나보겠습니다.

[크레딧]

이번 에피소드는 제니퍼 스트롱(Jennifer Strong), 앤서니 그린(Anthony Green), 에마 실러켄스(Emma Cillekens)가 제작을 맡았고, 마이클 라일리(Michael Reilly)가 편집했으며, 개럿 랭(Garret Lang)이 믹싱, 제이콥 고스키(Jacob Gorski)가 음악, 에릭 몬쥬언(Eric Mongeon)과 스테파니 아넷(Stephanie Arnett)이 예술 디자인을 담당했다.

[원고]

제니퍼 스트롱: 2020년 1월, 코로나19 바이러스의 염기서열이 처음 밝혀졌습니다. 이를 시작으로 전 세계가 코로나19 백신 개발에 박차를 가했으며, 세계 각국에서 정부와 제약업계 사이에 전례 없이 긴밀한 협조가 이루어졌습니다.이 노력은 실제로 효과가 있었습니다. 몇 달 후 미 연방정부는 코로나19 백신들에 대한 긴급사용권한을 승인했습니다.

저는 <그때 내가 그곳에 있었다>의 제니퍼 스트롱입니다. 이 팟캐스트는 인공지능 및 컴퓨팅 분야의 주요 사건들이 어떻게 벌어졌는지, 당시의 이야기를 들려주는 구술(oral) 역사 프로젝트입니다. 해당 사건을 직접 본 목격자의 목소리를 들어보는 방송이죠.

이번 에피소드에서는 모더나(Moderna)의 데이터 및 인공지능 분야 최고책임자 데이브 존슨(Dave Johnson)을 만나보겠습니다.

데이브 존슨: 모더나는 mRNA 기술의 가능성을 보고 설립된 생명공학기술 회사입니다. 저는 현재 모더나에서 데이터 및 인공지능 분야 최고책임자로 일하고 있습니다. mRNA는 기본적으로 ‘정보 분자(information molecule)’입니다. 이것은 아미노산의 서열로 암호화되어 있으며, 체내 세포로 들어가 단백질 생성에 관여합니다. 이렇게 생성된 단백질은 체내에서 다양한 기능을 할 수 있습니다. 예를 들어 희귀 질환을 치료할 수 있고, 향후에 항암제로 이용될 수 있으며, 코로나바이러스와 같은 바이러스에 맞서 싸우는 백신이 될 수도 있습니다.

이 접근법이 기존의 약제 개발과 본질적으로 다른 점은 개발 단계에서부터 좀 더 설계에 기반하고 있다는 것입니다. 우리는 체내에서 효과가 있을 만한 단백질이 무엇인지 이미 알고 있는 상태에서 그에 적합한 정보 분자를 설계합니다.

익히 알려진 것처럼 의약품 개발은 여러 단계에 걸쳐 순차적으로 진행됩니다. 초기 구상을 토대로 실험실에서 여러 소규모 실험을 거친 다음, 전임상 단계로 나아가는 방식입니다. 그리고 이 결과들이 모두 잘 나오면 비로소 인간 대상 임상시험을 비롯해 여러 임상 단계를 추진할 수 있게 됩니다. 임상시험은 크게 1, 2, 3상으로 나뉘는데 가장 큰 규모로 이루어지는 3상 임상시험에서는 사람을 대상으로 약의 유효성을 입증하게 됩니다.

이 모든 과정에는 무척이나 큰 비용이 듭니다. 수십억 달러의 자본과 더불어 길게는 10년의 긴 시간이 소요될 수 있습니다. 이 가운데 대다수는 실패로 돌아갑니다. 백신이나 치료법이 없는 질병이 여전히 많은 이유는 사람들이 시도를 안 해서 그런 것이 아니라, 아직 이러한 약제들이 개발 단계에 있기 때문입니다.

우리는 이러한 점에 착안하여 회사를 세웠습니다. 어떻게 하면 이 시간을 단축할 수 있을까요? 어떻게 하면 제한된 시간 내에 훨씬 더 많은 약제를 개발할 수 있을까요? 저는 이러한 질문을 가지고 이 회사에 합류했습니다. 저는 원래 소프트웨어 엔지니어링과 데이터과학 분야에 있었고, 데이터과학과 매우 근접한 분야인 정보물리학(information physics)이라는 전공으로 박사학위를 받았습니다.

저는 전 직원이 200명 정도밖에 되지 않던 극 초창기에 이 회사에 들어왔습니다. 우리는 전임상 단계에서 ‘엔진’ 역할을 할 수 있는 시스템을 구축하고자 했습니다. 수많은 아이디어를 단번에 표적화하고, 실험하며, 학습할 방법, 그리고 이를 반복하는 방법에 대해 연구했습니다. 백여 개의 실험을 한 번에 수행하여 빠르게 결과를 얻고, 그 결과를 토대로 다음 단계로 나아가는 기술을 개발하려 한 것입니다.

많은 실험을 수행하기 위해서는 그만큼 많은 mRNA를 처리할 수 있어야 합니다. 그래서 우리는 방대한 양의 mRNA를 한꺼번에 처리할 수 있는 자동 수행 시스템을 구축했습니다. 그 과정 동안에는 많은 것을 통합해야 했고, 우리는 각 단계를 로봇화하여 함께 처리할 수 있도록 설계했습니다. 이처럼 효율적인 시스템을 통해 데이터를 얻을수록 우리는 더 많은 것을 알 수 있었는데, 바로 이 지점에서 인공지능(AI)을 활용하였습니다. 단지 실험에서 나온 데이터를 얻는 것에서 그치지 않고, 데이터를 활용해 더 정교한 예측을 하게 된 것입니다.

여기에는 끊임없이 데이터를 들여다보며 분석하는 과학자들의 통찰법을 참조하였습니다. 과학자들의 분석 과정을 자동화한 모델과 알고리즘을 개발한 것입니다. 결과를 예측하고, 데이터의 질을 높이는 등, 우리는 AI를 통해 여러 일 처리를 더욱 신속하게, 잘 수행할 수 있도록 만들었습니다.

그러던 어느 날 찾아온 코로나19 팬데믹은 우리에게 무척 강렬한 계기가 되었습니다. 그동안 우리가 구축해 놓은 시스템, 우리가 배우고 연구해왔던 그 모든 지식을 현실 상황에 실제로 적용할 수 있게 되었기 때문입니다. 중국 당국이 코로나19 바이러스의 염기서열 정보를 최초로 발표한 지 42일 만에 우리는 백신 후보물질을 만들어냈습니다.

42일 동안 우리는 임상에서 사용할 수 있을 정도로 많은 백신을 안전하게 생산하여 진료소까지 배송할 수 있는 시스템을 갖추었습니다. 이는 전례 없는 속도로 빠르게 이루어졌습니다. 아마 많은 사람이 놀랐을 것입니다. 하지만 실제로 우리가 이 지점까지 오는 데에는 10년의 세월이 걸렸습니다. 우리는 연구를 최대한 빠르게 진행시킬 수 있는 엔진을 구축하는 데 10년을 쓴 것이죠. 그러나 우리의 활약은 거기서 그치지 않았습니다.

우리는 어떻게 하면 데이터과학과 AI를 활용해서 가장 효과적인 임상시험 결과를 얻을 수 있을지 고민했습니다. 당시 우리는 약의 효능을 입증하기 위해 30,000명 규모의 거대한 3상 임상시험을 실시해야 했는데, 이것이 우리가 초반에 극복해야 했던 가장 큰 난관이었습니다.

정말 큰 규모의 임상시험을 해야 했습니다. 하지만 그때는 이미 코로나바이러스가 수많은 사람들에게 전염되고 있던 시기였습니다. 우리는 임상시험을 실시할 만한 후보 지역을 미국 내에서 100군데 정도 찾아냈습니다. 그리고 인종적 다양성을 가진 장소를 찾아 균형을 맞췄으며, 국가 차원에서 대표성을 충분히 인정받을 수 있을 만한 결과를 얻고자 했습니다.

균형을 맞춘다는 것은 실로 현실적인 문제였습니다. 질 좋은 데이터를 얻기 위해서는 적당한 규모의 시설과 임상시험 장소가 있어야 했습니다. 또 코로나바이러스가 아직 퍼지지 않은 곳이어야 했습니다. 가령 그 당시 뉴욕의 경우, 이미 코로나가 덮쳐 임상시험 데이터를 쌓기에는 이상적이지 못했습니다.

그래서 우리는 코로나바이러스가 아직 유행하지 않은 동시에, 백신 후보물질 접종 후 약 6주 후에 감염자가 급증할 만한 지역을 찾아야 했습니다. 그런 점에서 이것은 무척 어려운 문제였습니다. 이 문제는 우리 힘만으로는 해결할 수 없었습니다.

우리는 수많은 외부 조력자들과 협력했습니다. 그리고 다 말하지 못할 정도로 수많은 역학 모델들을 참조했습니다. 너무 많은 이들이 역학 전문가를 자처했습니다. 하지만 우리는 그 모든 정보를 우리의 내부 의사결정에 반영하였고, 임상시험을 실시하기 위한 최적의 장소들을 찾기 위해 이를 활용했습니다.

임상시험이 진행되던 와중에도 우리는 어떻게 하면 이를 더욱 개선하여 잘해 나갈 수 있을지 고민했습니다. 그래서 우리 임상시험의 결과가 미국을 대표할 수 있도록 만들기 위해 참여자들을 실시간으로 분석했으며, 참여자들의 연령, 성별, 인종적 다양성 등 여러 측면에서 모니터링하여 임상시험을 보완하고자 했습니다.

임상시험이 대략 80% 정도 진행되었을 때, 우리는 이대로 라면 우리가 원하던 대로의 균형 잡힌 결과를 얻을 수 없다는 것을 깨달았습니다. 그 시점에서 우린 정말 어려운 결정을 해야 했습니다. 결국 우리는 몇몇 지역들을 포기하고, 임상시험이 대표성을 확보하는 데 도움이 되는 다른 지역들에 집중하기로 했습니다.

코로나19 팬데믹 시작부터 백신 사용 긴급 승인을 받기까지는 모두 통틀어 약 1년이라는 시간이 필요했습니다. 다시금 강조하자면, 이것은 보통 수년은 걸리는 일이 무척이나 예외적으로 단축된 것입니다. 이 경험은 제 개인에 있어 참 놀랍고 가슴 뛰는 순간이었습니다. 약 8년 전 이 회사에 처음 합류했을 때만 해도 회사에서 백신을 취급하기 전이었기 때문에, 우리 약 중 하나를 실제로 쓰게 될 것이라고는 상상도 하지 못했습니다. 우리 자신과 가족들, 친구들, 전 세계 모든 사람을 위해 백신이 사용되는 것을 보면서 우리는 경이로움을 느꼈습니다.

제니퍼: <그때 나는 그곳에 있었다>는 인공지능이나 컴퓨팅 분야에서 돌파구를 목격했거나 만들어낸 사람들의 이야기를 들려주는 역사 프로젝트입니다.  지금까지 제작에 저와 앤서니 그린, 에마 실러켄스, 편집에 마이클 라일리, 믹싱에 개럿 랭이었습니다. 청취에 감사드립니다. 제니퍼 스트롱이었습니다.

미리보기 2회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.