AIs that read sentences are now catching coronavirus mutations

말 잘하는 인공지능이 코로나 변이도 잡는다

자연어처리(NLP) 알고리즘이 바이러스의 유전적 변화 해석에도 쓰일 전망이다. 이에 따라 코로나 변이 예측을 위한 연구가 가속화되고 있다.

갈릴레오는 자연이 수학으로 쓰여 있다고 했다. 생물학은 언어로 쓰여 있을 지 모른다. 자연어처리(NLP) 알고리즘은 이제 단백질 서열을 생성하고 바이러스 변이를 예측할 수 있다. 여기에는 코로나 바이러스가 면역 체계를 회피할 수 있게 하는 변이도 포함된다.

이것이 가능한 이유는 생물학적 시스템의 상당수 속성이 단어와 문장으로 해석될 수 있기 때문이다. MIT 컴퓨터 생물학자 보니 버거(Bonnie Berger)는 “우리는 진화의 언어(language of evolution)를 배우는 중”이라고 말한다.

지난 몇 년 동안, 유전학자 조지 처치(George Church) 연구실과 세일즈포스 등 몇몇 연구자들은 NLP 기술로 단백질 서열과 유전자 코드를 모델링할 수 있음을 입증하였다.

최근 사이언스(Science)에 발표된 연구에 따르면, 버거 교수팀은 NLP를 활용해 바이러스가 면역 시스템을 회피하기 위해 일으키는 변이를 예측한다. 인체 면역 시스템의 항체는 바이러스를 감지해 이들의 침투를 막고, 바이러스는 면역 회피(Viral Immune Escape)라는 과정을 통해 이 과정을 피해 간다. 면역 체계가 바이러스의 정보를 번역하는 과정은 마치 사람이 문장을 해석하는 과정과 비슷하다.

세일즈포스에서 NLP로 단백질 서열을 예측하는 연구를 하는 알리 마다니(Ali Madani)는 “기존 연구를 기반으로 새로운 활력을 불어넣는 멋진 논문”이라고 평가했다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!