fbpx
This is the most misunderstood graph in AI

AI 발전을 둘러싼 과열된 해석, METR 그래프의 진짜 의미

AI의 도약을 보여주는 METR 그래프는 유토피아나 종말의 신호로 읽히곤 하지만, 그 해석에는 보다 신중한 접근이 필요하다.

오픈AI, 구글, 앤트로픽이 새로운 최전선급 대형언어모델(LLM)을 내놓을 때마다 인공지능(AI) 업계는 숨을 죽인다. 비영리 AI 연구기관인 ‘METR’이 해당 모델을 분석한 그래프를 공개할 때까지다. 지난해 3월 처음 등장한 이 그래프는 이후 AI 담론에서 상징적인 지표로 자리 잡았다. 특정 AI 능력이 기하급수적으로 발전하고 있음을 보여주는 이 그래프에서 최근 공개된 모델들은 이미 인상적이었던 기존 추세마저 가뿐히 뛰어넘는 성능을 기록하고 있다.

이 같은 흐름은 앤트로픽의 최상위 모델인 ‘클로드 오퍼스 4.5(Claude Opus 4.5)’에서도 뚜렷하게 나타났다. 지난해 11월 말 공개된 이 모델에 대해 METR는 약 한 달 뒤 “인간이라면 약 5시간이 걸릴 작업을 오퍼스 4.5가 독립적으로 수행할 수 있는 것으로 보인다”고 평가했다. 이는 기존의 기하급수적 성장 곡선을 기준으로 예상했던 수준을 크게 웃도는 결과였다.

이 발표가 전해지자 앤트로픽 내부에서도 반응이 나왔다. 한 안전성 연구원은 소셜미디어에 “이 결과를 보고 연구 방향을 바꾸게 됐다”고 적었고, 또 다른 직원은 “엄마, 무서워서 집에 가고 싶어요”라는 짧은 글을 남겼다.

다양한 LLM이 50% 성공 확률로 완료할 수 있는 소프트웨어 작업의 시간 지평 / 가로: LLM 출시 일

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!