MITTR | VIDEO STILLS: U/WUBBZYPC, @HASHEMGHAILI
Google’s generative video model Veo 3 has a subtitles problem
구글 최신 영상 생성 모델, 엉터리 자막 문제로 구설수
구글의 최신 영상 생성 AI 모델이 출시된 지 한 달이 넘었지만 사용자 요청과 무관하게 영상에 불필요한 자막이 추가되는 오류가 계속되고 있다.
구글이 5월 말 새로운 영상 생성 AI 모델 비오 3(Veo 3)를 출시하자 창작자들은 앞다퉈 그 성능을 시험하기 시작했다. 이전 모델 출시 후 불과 몇 달 만에 공개된 비오 3는 영상 생성 모델 중 최초로 음향과 대사 생성 기능을 제공하기 때문이다.
이를 활용해 만든 광고, ASMR 영상, 상상에 기반한 영화 예고편, 유쾌한 거리 인터뷰 등 다양한 형태의 현실감 넘치는 8초짜리 영상들이 순식간에 온라인에 확산됐다(구글의 비오 3는 8초짜리 영상까지 생성할 수 있다).
아카데미상 후보에 올랐던 대런 애러노프스키(Darren Aronofsky) 감독은 비오 3를 이용해 단편 영화 <앤세스트라(Ancestra)>를 제작하기도 했다. 데미스 허사비스(Demis Hassabis) 구글 딥마인드 CEO는 기자간담회에서 이러한 성과를 “무성 영화 시대를 벗어나는 발전”에 비유했다.
하지만 사용자들은 이 모델에 예상치 못한 문제가 있다는 사실을 곧 알게 되었다. 비오 3가 대사가 포함된 영상을 생성할 때 종종 의미 없는 엉터리 자막을 추가하는 문제다. 이런 오류는 캡션이나 자막을 넣지 말라는 프롬프트를 입력한 경우에도 마찬가지로 나타난다.
이 불필요한 자막을 없애기는 간단하지 않을뿐더러 비용도 많이 든다. 사용자들은 울며 겨자 먹기로 (추가 비용을 내고) 영상을 다시 생성하거나 외부 자막 제거 도구를 사용하거나 자막이 포함된 부분을 잘라낼 수밖에 없었다.