AI for protein folding

‘단백질 접힘’ 예측용 AI

딥마인드가 단백질 구조를 예측하는 AI를 통해 생물학계가 50년 동안 풀지 못했던 난제를 해결하며 신약을 발굴하고 설계할 수 있는 새로운 경로를 개척했다.

핵심 플레이어: 딥마인드(DeepMind), 아이소모픽 랩스(Isomorphic Labs)

실용화 시기: 현재

2020년 말에 영국에 본사를 둔 인공지능(AI) 연구소 딥마인드는 AI 분야에서 이미 다수의 인상적인 업적을 이루어 낸 회사로 주목받고 있었다. 그런 딥마인드가 그해 11월에 ‘단백질 접힘(protein folding)’을 예측하는 프로그램을 발표하자 이 프로그램의 놀라운 정확성에 생물학자들이 큰 충격을 받았다.

20가지의 아미노산으로 구성되어 있는 단백질의 특징 중 하나는 구성요소의 종류와 순서에 따라 다른 3차원 구조를 갖는다는 것이다. 이러한 현상을 단백질 접힘이라 부른다.

우리 몸이 하는 대부분의 일에는 단백질이 관여한다. 따라서 여러 신약을 개발하고 많은 질병을 이해하기 위해서는 개별 단백질의 역할을 제대로 이해하는 것이 매우 중요하다. 그리고 이러한 단백질의 역할은 단백질의 3차원 구조에 따라 결정된다.

단백질은 복잡한 형태로 꼬이거나 둥글게 말려서 엉킨 채로 접혀 있는 끈 모양의 아미노산들로 이루어져 있다. 이러한 단백질의 구조를 파악하여 어떤 단백질의 기능을 알아내려면 실험실에서는 몇 달씩 소요될 수 있다. 단백질 구조를 알아내는 시간을 단축하고 구조를 더 쉽게 파악하기 위해서 수년 동안 과학자들은 컴퓨터를 활용한 예측 방법들을 시도해왔다. 그러나 어떤 방법을 사용해도 과학자들이 실험실에서 직접 파악한 결과보다 정확성이 크게 떨어졌다.

이러한 상황에 변화를 가져온 것이 딥마인드가 개발한 알파폴드2(AlphaFold2)였다. 딥러닝(deep learning)이라는 AI 기술을 사용한 알파폴드2는 원자 수준에서 단백질의 형태를 예측할 수 있으며, 실험실에서 오랜 시간에 걸쳐 파악한 것에 필적할 만큼 정확도가 높은 첫 번째 컴퓨터 소프트웨어이다.

전 세계 과학 연구팀들은 암, 항생제 내성, 코로나19 등의 연구에 알파폴드2를 활용하기 시작했다. 딥마인드는 알파폴드2가 예측한 단백질 구조로 가득 채운 공개 데이터베이스도 만들었다. 이 데이터베이스에는 현재 80만 개 항목이 등록되어 있으며, 딥마인드는 앞으로 1년 내에 1억 개 이상의 단백질 구조를 데이터베이스에 추가할 것이라고 밝혔다. 1억 개는 과학계에 알려진 거의 모든 단백질 수에 해당한다.

딥마인드는 이 작업을 수행할 아이소모픽 랩스라는 자회사를 만들면서, 아이소모픽 랩스가 다른 바이오테크 및 제약 회사들과 협력할 것이라고 밝혔다. 알파폴드2가 과학계에 어떤 영향을 미칠지 확인하기까지는 1년에서 2년 정도의 시간이 걸리겠지만, 그 잠재력은 이미 전 세계의 여러 실험실에서 빠르게 드러나고 있다.

By 윌 더글러스 헤븐(Will Douglas Heaven)

미리보기 2회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.