구글 최신 영상 생성 모델, 엉터리 자막 문제로 구설수

구글의 최신 영상 생성 AI 모델이 출시된 지 한 달이 넘었지만 사용자 요청과 무관하게 영상에 불필요한 자막이 추가되는 오류가 계속되고 있다.

2025년 7월 22일

구글이 5월 말 새로운 영상 생성 AI 모델 비오 3(Veo 3)를 출시하자 창작자들은 앞다퉈 그 성능을 시험하기 시작했다. 이전 모델 출시 후 불과 몇 달 만에 공개된 비오 3는 영상 생성 모델 중 최초로 음향과 대사 생성 기능을 제공하기 때문이다.

이를 활용해 만든 광고, ASMR 영상, 상상에 기반한 영화 예고편, 유쾌한 거리 인터뷰 등 다양한 형태의 현실감 넘치는 8초짜리 영상들이 순식간에 온라인에 확산됐다(구글의 비오  3는 8초짜리 영상까지 생성할 수 있다).

아카데미상 후보에 올랐던 대런 애러노프스키(Darren Aronofsky) 감독은 비오 3를 이용해 단편 영화 <앤세스트라(Ancestra)>를 제작하기도 했다. 데미스 허사비스(Demis Hassabis) 구글 딥마인드 CEO는 기자간담회에서 이러한 성과를 “무성 영화 시대를 벗어나는 발전”에 비유했다.

하지만 사용자들은 이 모델에 예상치 못한 문제가 있다는 사실을 곧 알게 되었다. 비오 3가 대사가 포함된 영상을 생성할 때 종종 의미 없는 엉터리 자막을 추가하는 문제다. 이런 오류는 캡션이나 자막을 넣지 말라는 프롬프트를 입력한 경우에도 마찬가지로 나타난다.

이 불필요한 자막을 없애기는 간단하지 않을뿐더러 비용도 많이 든다. 사용자들은 울며 겨자 먹기로 (추가 비용을 내고) 영상을 다시 생성하거나 외부 자막 제거 도구를 사용하거나 자막이 포함된 부분을 잘라낼 수밖에 없었다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!

구글 최신 영상 생성 모델, 엉터리 자막 문제로 구설수

개인정보 수집 및 이용

인기 기사

구글 최신 영상 생성 모델, 엉터리 자막 문제로 구설수

MIT Technology Review 뉴스레터 구독

가장 빠르게 최신 콘텐츠를 받아 보세요.

개인정보 수집 및 이용

인기 기사

연관 토픽

미토스보다 현실적인 위협…메타 해킹이 드러낸 AI 보안의 맹점

AI 챗봇 사용으로 우리는 뇌의 통제력을 잃고 있을까?

변호사 대신 챗봇…AI가 바꾼 법정 풍경

혼자서 사업하기 버겁다면…소규모 사업자의 AI 활용법