Why Meta’s latest large language model survived only three days online

메타의 최신 대규모 언어모델이 등장 3일 만에 자취를 감춘 이유

메타가 과학자들에게 도움을 주려고 공개한 대규모 언어모델 ‘갤럭티카’는 편향적이고 부정확하며 비상식적인 결과만 생산했다.

메타는 11월 15일 과학자들에게 도움을 주려는 목적으로 설계된 ‘갤럭티카(Galactica)’라는 새로운 대규모 언어모델(large language model)을 공개했다. 그러나 갤럭티카는 메타가 원했던 대로 돌풍을 일으키며 자리를 잡기는커녕 격렬한 비난에 시달린 끝에 3일 만에 말 그대로 ‘사망’했다. 메타는 모두에게 시험해보라고 장려했던 공개 데모를 17일 삭제했다.

메타의 실수와 자만은 기술 대기업이 대규모 언어모델이 가진 심각한 한계에 대해 맹점을 가지고 있다는 사실을 재차 확인해준다. 이미 많은 연구를 통해 드러난 바와 같이 대규모 언어모델에는 편견을 재현하고 거짓을 사실처럼 주장하는 등의 여러 결함이 있다.

그러나 메타를 비롯해서 대규모 언어모델을 개발하고 있는 구글 같은 기술 기업들은 이러한 문제를 심각하게 받아들이지 않고 있다.

갤럭티카는 4,800만 개의 과학 기사, 웹사이트, 교과서, 강의 노트, 백과사전 데이터로 학습한 ‘과학을 위한’ 대규모 언어모델이다. 메타는 이 모델이 연구원과 학생들을 위한 ‘지름길’이 되어줄 것이라며 제품을 홍보했다. 메타의 말을 빌리자면 갤럭티카는 “학술 논문을 요약하고 수학 문제를 해결하며 위키(Wiki) 기사를 생성하고 과학 코드를 작성하고 분자와 단백질에 주석을 다는 등 다양한 일을 할 수 있다.”

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!