
실험 설계부터 분석까지…英, ‘AI 과학자’로 연구 자동화 속도 낸다
혁신적인 연구개발(R&D)을 지원하는 영국 정부 기관인 ARIA(Advanced Research and Invention Agency)가 연구 공모를 통해 실험실에서 실험을 설계하고 수행하는 ‘AI 과학자’ 시스템을 개발 중인 스타트업과 대학 연구팀을 선별했다.
본 공모에는 이미 실험 작업의 상당 부분을 자동화할 수 있는 도구를 개발 중인 연구자들로부터 245건의 제안서가 접수돼 자동화 기술의 발전 속도가 얼마나 빠른지를 여실히 보여줬다.
ARIA는 ‘AI 과학자’를 ‘가설을 도출하고, 이를 검증하기 위한 실험을 설계·실행한 뒤 그 결과를 분석하는 전체 과학적 연구 과정을 수행할 수 있는 시스템’으로 정의한다. AI 과학자에는 로봇 생물학자와 화학자도 포함된다. 많은 경우 이 시스템은 결과를 다시 스스로에게 입력해 동일한 과정을 반복적으로 수행하는 루프를 계속 실행한다. 이 과정에서 인간 과학자는 감독자 역할을 맡아 초기 연구 질문만 제시한 뒤 반복적이고 수고로운 작업은 AI 과학자에게 맡긴다.
이와 관련해서 ARIA의 앤트 로스트런(Ant Rowstron) CTO는 “실험이 끝났는지 확인하도록 새벽 3시까지 실험실에서 기다리게 하는 것보다 박사과정 학생의 시간을 더 가치 있게 활용할 방법을 찾는 것”이라며 공모 목적을 설명했다.
ARIA는 접수된 245건의 제안서 중 12개 프로젝트를 선정했다. 제출된 제안서의 수가 많았을 뿐 아니라 전반적인 수준도 매우 높았기 때문에 당초 계획했던 지원 금액을 두 배로 늘렸다. 선정된 팀 중 절반은 영국, 나머지는 미국과 유럽의 연구팀이다. 대학 소속 팀도 있고 산업계 팀도 있다. 각 팀은 9개월간의 연구에 약 50만 파운드(약 10억 원)를 지원받게 된다. 연구 기간이 끝나면 각 팀은 팀에서 개발한 AI 과학자가 새로운 과학적 발견을 도출할 수 있었다는 사실을 입증해야 한다.
선정된 팀 중 하나는 미국 기업인 라일라 사이언스(Lila Sciences)로, 이 연구팀은 ‘AI 나노 과학자(AI nano-scientist)’라는 시스템을 개발하고 있다. 해당 시스템은 의료 영상, 태양광 패널, QLED TV 등에 사용되는 나노미터 크기의 반도체 입자인 양자점(quantum dot, 또는 ‘퀀텀닷’)을 어떻게 조합하고 가공해야 최적의 성능을 낼 수 있는지 알아내기 위한 실험을 설계하고 수행할 예정이다.
라일라 사이언스의 라파 고메스-봄바렐리(Rafa Gómez-Bombarelli) 물리과학 부문 CSO는 “우리는 이번 지원금과 시간을 통해 하나의 핵심 주장을 입증하려고 한다”고 강조했다. 그러면서 “이번에 받을 지원금으로 특정 과학 문제에 대한 실제 AI 로보틱스 루프를 설계하고 해당 시스템이 실제로 작동한다는 증거를 확보할 것이며 다른 사람들이 시스템을 재현하고 확장할 수 있도록 연구 과정을 문서화할 수 있을 것”이라고 설명했다.
지원 대상으로 선정된 또 다른 팀인 영국 리버풀 대학교 연구팀은 ‘로봇 화학자’를 개발하고 있다. 로봇 화학자는 여러 실험을 동시에 수행할 수 있으며 오류 해결을 위해 시각 정보와 언어를 함께 처리하는 비전-언어 모델을 활용한다.
런던에 위치한 스타트업 한 곳도 지원 대상으로 선정됐다. 아직 외부에 자세한 정보를 공개하지 않은 이 회사는 세타월드(ThetaWorld)라는 AI 과학자를 개발하고 있다. 세타월드는 대형언어모델(LLM)을 활용해 배터리 성능에 중요한 물리화학적 상호작용을 연구하는 실험을 설계한다. 이렇게 설계된 실험은 자동화된 실험실에서 수행될 예정이다.
기준선 파악
ARIA가 보통 2~3년에 걸쳐 지원하는 500만 파운드 규모의 지원금과 비교하면 50만 파운드는 그다지 큰돈이 아니다. 그러나 로스트런 CTO는 “그것이 바로 의도한 바”라고 밝혔다. 이번 연구비 지원 자체가 ARIA에도 하나의 실험이라는 뜻이다. ARIA는 짧은 기간에 걸쳐 다양한 프로젝트를 지원함으로써 연구 수행 방식이 어떻게 그리고 얼마나 빠르게 변화하고 있는지를 가늠해 보고 있다. 그 결과는 향후 대규모 프로젝트를 지원하기 위한 기준선이 될 예정이다.
로스트런 CTO는 특히 요즘처럼 주요 AI 기업 대부분이 과학 연구 전담 팀을 운영하고 있는 상황에서는 기술의 능력에 대한 ‘과장’이 많다는 점을 인정한다. 연구 결과가 보도자료로 공개될 경우 해당 기술이 실제로 무엇을 할 수 있고 무엇을 할 수 없는지 판단하기가 쉽지 않다. 로스트런 CTO는 이에 대해 “최첨단 연구를 지원하려는 연구 기관의 입장에서는 늘 어려운 문제”라면서 “최전선에서 무언가를 하려면 그 최전선이 어디인지부터 파악해야 한다”고 강조했다.
현재 최첨단 기술은 필요에 따라 기존의 여러 도구를 즉석에서 불러와 사용하는 에이전트형 시스템(agentic system)이다. 로스트런 CTO는 “에이전트 AI는 LLM을 이용해 아이디어를 도출하고 다른 모델을 사용해 최적화와 실험을 수행한 뒤 그 결과를 다시 시스템에 입력하는 식으로 작동한다”고 설명했다.
로스트런 CTO는 에이전트형 시스템이 여러 층으로 구성되어 있다고 생각한다. 가장 아래층에는 인간이 인간을 위해 설계한 AI 도구들이 있다. 예를 들어 단백질 구조를 예측하는 알파폴드(AlphaFold)와 같은 도구다. 이런 도구들은 과학 연구 과정에서 많은 노력과 시간이 필요한 단계에 큰 도움을 주지만, 결과를 검증하려면 여전히 수개월에 걸친 실험실 작업이 필요할 수 있다. AI 과학자의 목표는 바로 이 과정까지 자동화하는 것이다.
로스트런 CTO는 “AI 과학자는 인간이 만든 도구들보다 한 단계 상위 계층에 있으며 필요할 때마다 이러한 도구들을 호출해 사용한다”고 설명했다. 그는 “10년까지는 아니어도 언젠가 가까운 미래에는 AI 과학자 계층이 필요한 도구가 없다고 판단하면 알파폴드와 같은 새로운 도구를 스스로 만들어내는 시점이 올 것”이라면서 “그러면 그 아래의 모든 영역은 전부 자동화될 것”이라고 전망했다.
아직은 먼 이야기
다만 그는 아직 우리가 그 단계에 도달하지는 못했다고 덧붙였다. 현재 ARIA가 지원하는 모든 프로젝트는 새로운 도구를 만들어내기보다는 기존 도구를 호출해 활용하는 시스템에 머물러 있다.
에이전트형 시스템 전반에는 아직 해결되지 않은 문제들도 있다. 이 때문에 시스템이 스스로 오류를 내지 않고 방향을 벗어나지 않은 채 작동할 수 있는 시간에는 한계가 있다. 예를 들어 인도에 기반을 둔 AI 연구소 로스펑크(Lossfunk)의 연구진이 최근 온라인에 공개한 ‘LLM이 아직은 과학자가 아닌 이유(Why LLMs aren’t scientists yet)’라는 연구 결과를 보면 LLM 에이전트에게 과학 연구 과정을 끝까지 수행하게 하는 실험에서 네 번 중 세 번은 실패했다고 되어 있다. 연구진은 AI가 초기 설정 조건에서 벗어나 더 쉽고 익숙한 해결책 쪽으로 방향을 바꾸는 문제와 명백한 실패가 있어도 성공을 선언해 버리는 ‘과도한 흥분 상태’ 등이 실패 원인이라고 지적했다.
로스트런 CTO는 “분명히 지금 단계에서 이런 도구들은 아직 개발 초기 단계에 있고 성능이 어느 지점에서 정체될 수도 있다”며 “AI 과학자가 노벨상을 받을 거라고 기대하지는 않는다”고 말했다.
그럼에도 그는 “이 도구들 중 일부는 우리가 훨씬 더 빠른 속도로 움직여야만 하는 세상을 만들어낼 수도 있다”며 “우리가 결국 그런 세상에 도달하게 된다면 미리 대비하는 것이 그 무엇보다 중요할 것”이라고 덧붙였다.