I tested out a buzzy new text-to-video AI model from China
중국의 새로운 동영상 생성 AI 모델을 테스트 해봤다
중국의 AI 기업 콰이쇼우가 만든 생성형 동영상 모델 ‘클링’은 틱톡과 같은 플랫폼용 짧은 동영상을 제작하는 방식을 변화시킬 수 있을지도 모른다.
중국의 AI 기업인 ‘콰이쇼우(Kuaishou, 또는 콰이서우)’는 아직 많은 이들에게 낯선 이름일지도 모른다. 그러나 최근 콰이쇼우는 대중에게 각인될 수 있는 중대한 결정을 내렸다. 바로 텍스트를 입력하여 동영상을 생성할 수 있는 텍스트-비디오 생성형 AI(text-to-video generative AI) 모델을 업계 최초로 대중이 무료로 테스트할 수 있도록 출시한 것이다.
6억 명 이상의 활성 사용자를 보유한 콰이쇼우는 6월 6일에 클링(Kling)이라는 새로운 도구를 발표했다. 콰이쇼우의 웹사이트에 올라온 설명에 따르면 클링은 오픈AI(OpenAI)의 소라(Sora) 모델처럼 “30fps의 프레임률에 최대 1,080p의 해상도로 최대 2분짜리 동영상”을 생성할 수 있다.
오픈AI는 시범 서비스를 시작한 지 4개월이 지난 지금까지도 소라를 일반 대중에게 공개하지 않았지만, 클링은 누구나 직접 사용해 볼 수 있다.
필자도 클링을 시험해 보기로 했다. 필자는 콰이쇼우의 웹사이트에서 클링을 다운로드하고 중국 번호로 가입한 후 대기자 명단에 이름을 올렸다. 그리고 콰이쇼우의 사용자 피드백 그룹을 통해 추가 양식을 작성한 후에 클링을 이용해 볼 수 있었다. 클링은 영어로만 작성된 프롬프트(prompt)를 처리할 수 없지만, 원하는 문구를 중국어로 번역하거나 중국어 단어 한두 개를 포함시키는 방식으로 이 문제를 해결할 수 있다.