fbpx
A tiny new open-source AI model performs as well as powerful big ones

강력한 대형 AI 모델에 필적하는 소형 오픈소스 모델의 등장

주요 대형언어모델들과 대등한 성능을 구현하는 소형 오픈소스 AI 모델이 등장했다. 이는 양은 적더라도 수준 높은 데이터로 모델을 훈련하면 컴퓨팅 비용을 절감할 수 있음을 시사한다.

비영리 연구 단체인 앨런인공지능연구소(Ai2)는 오픈소스 멀티모달(multimodal·텍스트, 이미지, 음성, 비디오 등의 다양한 유형의 입력을 동시에 처리할 수 있게 하는 방식) 언어 모델들로 구성된 몰모(Molmo) 시리즈를 출시할 예정이다.

연구소에 따르면 이 모델은 가장 우수한 모델로 손꼽히는 오픈AI이나 구글이나 앤트로픽(Anthropic) 소유의 독점 모델에 견줄만한 성능을 보여준다.

Ai2는 “이미지, 차트, 문서 이해 능력 등을 측정하는 테스트에서 720억 개의 매개변수를 사용하는 가장 큰 규모의 몰모 모델이 오픈AI의 GPT-4o보다 우수한 성능을 보였다”고 주장했다. GPT-4o의 매개변수는 1조 개가 넘는 것으로 추정된다.

Ai2는 또 “70억 개의 매개변수로 작동하는 소형 몰모 모델이 성능 면에서 오픈AI의 최첨단 모델에 근접한 수준에 이르렀으며, 이는 훨씬 더 효율적인 데이터 수집 및 학습 방법 덕분”이라고 설명했다.

알리 파르하디(Ali Farhadi) Ai2 CEO는 “몰모는 오픈소스 인공지능(AI)의 개발 수준이 비공개 독점 모델과 동등한 수준에 이르렀음을 보여주는 증거”라고 주장했다.

오픈소스 모델은 소스 코드를 공개하여 누구나 접근하고 수정 및 배포할 수 있는 개방성 덕분에 다른 사람들이 기존 모델을 기반으로 애플리케이션을 추가 구축할 수 있다는 커다란 이점을 제공한다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!