fbpx
A startup claims it broke through a bottleneck that’s holding back LLMs

“트랜스포머 시대 끝낼 것”…LLM 병목 문제 해결했다는 스타트업 등장

미국 AI 스타트업 서브쿼드래틱이 AI가 방대한 문서를 처리할 때 발생하는 계산량 폭증 문제를 해결했다고 주장하며 새로운 AI 모델 '서브큐(SubQ)'를 공개했다. 독립 평가 결과도 긍정적으로 나오면서 AI 업계의 주목을 받고 있다.
📋한눈에 보는 AI 요약AI 자동 요약▶ 펼쳐보기

미국의 작은 AI 스타트업 서브쿼드래틱이 기존 AI 모델의 가장 큰 약점인 계산량 폭발 문제를 해결했다고 주장하며 등장했습니다. 현재 대부분의 AI 모델은 글이 길어질수록 계산량이 급격히 늘어나서 비용과 전력 소비가 크게 증가하는 문제를 안고 있습니다. 서브쿼드래틱은 모든 단어를 다른 모든 단어와 비교하는 대신, 중요한 관계만 골라서 계산하는 방식으로 속도를 최대 56배까지 높이고 비용도 크게 줄였다고 합니다. 독립 평가 기관의 테스트에서 실제로 좋은 성적을 거두었지만, 아직 일반인이 직접 써볼 수 없어서 완전한 검증은 이루어지지 않은 상태입니다. 업계에서는 혁신적 돌파구일 수도 있고 과장된 주장일 수도 있다며 관망하는 분위기입니다.

왜 중요한가요?

AI를 사용할 때 드는 비용과 전기 소비는 매우 큰 사회적 문제인데, 이 기술이 실제로 작동한다면 AI 서비스가 훨씬 저렴하고 친환경적으로 바뀌어 우리 일상에서 AI를 더 쉽게 활용할 수 있게 될 것이기 때문에 중요합니다.

주요 용어 설명
트랜스포머 (Transformer)

현재 거의 모든 AI 언어 모델의 핵심 뼈대가 되는 구조입니다. 문장 속 단어들 사이의 관계를 파악해서 글의 의미를 이해하는 방식인데, 마치 교실에서 모든 학생이 다른 모든 학생과 한 번씩 대화해야 하는 것처럼 작동합니다. 2017년 구글이 발표한 이후 AI 발전의 핵심 기술로 자리 잡았습니다.

밀집 어텐션 (Dense Attention)

텍스트 안의 모든 단어를 다른 모든 단어와 하나하나 비교하며 관계를 계산하는 방식입니다. 시험 공부할 때 교과서의 모든 문장을 다른 모든 문장과 연결 짓는 것과 비슷한데, 글이 길어지면 비교해야 할 조합이 폭발적으로 늘어나서 엄청난 계산 비용이 들게 됩니다.

희소 어텐션 (Sparse Attention)

모든 단어를 전부 비교하는 대신, 의미 파악에 정말 중요한 단어 조합만 골라서 비교하는 방식입니다. 책을 읽을 때 모든 단어를 다른 모든 단어와 연결 짓지 않고, 핵심 내용 위주로 읽는 것과 비슷합니다. 계산량을 크게 줄일 수 있지만, 어떤 관계를 골라야 할지 잘 선택하는 것이 핵심 과제입니다.

컨텍스트 윈도우 (Context Window)

AI 모델이 한 번에 읽고 기억할 수 있는 텍스트의 최대 크기를 말합니다. 사람이 시험 볼 때 펼쳐놓을 수 있는 참고 자료의 양에 비유할 수 있습니다. 서브큐는 이 크기가 1,200만 토큰으로, 보통 모델의 100만 토큰보다 약 12배 많은 정보를 한꺼번에 처리할 수 있다고 합니다.

이차적 증가 (Quadratic Expansion)

입력 데이터가 늘어날 때 계산량이 그 제곱에 비례해서 급격히 커지는 현상입니다. 예를 들어 단어 수가 2배로 늘면 계산량은 약 4배, 10배로 늘면 약 100배가 됩니다. 마치 파티 참석자가 늘어날 때 서로 악수해야 하는 횟수가 사람 수보다 훨씬 빠르게 늘어나는 것과 같은 원리입니다.

⚡ Claude AI가 독자를 위해 자동 생성한 요약입니다. 원문을 함께 읽어보세요.

미국 마이애미에 기반을 둔 AI 스타트업 서브쿼드래틱(Subquadratic)은 지난 5월 비공개 개발을 마치고 모습을 드러내며 대담한 주장을 펼쳤다. 10년 가까이 대형언어모델(LLM)의 발전을 가로막아온 수학적 병목 문제를 해결했다는 것이다.

처음에는 많은 정보를 공개하지 않았기 때문에 업계의 반응은 냉담했다. 그러나 서브쿼드래틱은 새 기술에 대한 독립 평가 결과를 공개하며 근거를 제시하기 시작했다. 평가 결과를 보면 이들의 주장을 그냥 흘려듣기가 어려울 수도 있다.

서브쿼드래틱은 ‘서브큐(SubQ)’라는 새로운 종류의 LLM을 개발했다고 밝혔다. 그러면서 서브큐가 현재 시장에 나온 다른 어떤 모델보다 빠르고 비용과 에너지 소비가 적으며, 한번에 최대 12배 많은 텍스트를 처리할 수 있다고도 주장했다. 수백 건의 문서를 분석하거나 대규모 코드베이스를 검토하는 작업에 특히 강점을 가졌다는 설명이다.

서브쿼드래틱은 또한 서브큐가 대규모 텍스트를 처리하면서도 코딩 같은 핵심 작업에서는 구글 딥마인드와 오픈AI, 앤트로픽이 내놓은 최고 수준 모델과 비견할 만한 성능을 보인다고 주장했다.

문제는 서브쿼드래틱이 처음에는 이런 주장을 뒷받침할 만한 근거를 거의 내놓지 않았다는 점이다. 자체적으로 공개한 몇 가지 테스트 점수가 전부였다. 서브큐 또한 아직 사람들이 직접 사용해볼 수 있을 만큼 널리 공개되지 않았다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!