Meta’s new AI models can recognize and produce speech for more than 1,000 languages

메타의 새 AI 모델은 1,000여개 언어를 인식하고 음성을 생성할 수 있다

메타가 공개한 새 AI 모델은 기존의 음성앱보다 훨씬 많은 언어를 지원하는 앱 개발에 도움을 줄 수 있을지도 모른다.

메타(Meta)가 1,000개가 넘는 다양한 언어로 음성을 인식하고 생성할 수 있는 AI 모델을 개발했다. 이는 기존의 음성 인식 AI에서 지원하는 언어 수보다 10배나 많은 수치이다. 메타는 이번 모델 개발이 “사라질 위험에 놓인 언어를 보존하기 위한 중요한 단계”라고 말한다.

메타는 코드 호스팅 서비스 깃허브(GitHub)를 통해 이번 AI 모델들을 공개하면서, 해당 모델을 오픈소스로 공개하면 서로 다른 언어로 작업하는 개발자들이 새로운 음성 앱을 개발하는 데 도움이 될 것이라고 주장한다. 이러한 음성 앱에는 모든 언어를 이해하는 메시지 서비스나 어떤 언어로든 이용할 수 있는 가상현실 시스템 등이 있을 수 있다.

전 세계에는 7,000여 개의 언어가 존재하지만, 현존하는 음성 인식 모델은 그중에서 약 100개의 언어만 제대로 지원한다. 그 이유는 이러한 유형의 AI 모델을 학습시키려면 데이터에 이름을 붙이는 라벨링 작업이 완료된 방대한 학습 데이터가 필요한데, 그런 학습 데이터를 이용할 수 있는 언어가 주로 영어, 스페인어, 중국어 등 소수에 불과하기 때문이다.

메타의 연구원들은 이 문제 해결을 위해 다른 방법을 활용했다. 이들은 음성을 텍스트로 기록한 전사본(transcript) 등 라벨링 작업이 되어 있는 대규모의 데이터 없이도 AI 모델이 음성을 통해 발화 패턴을 학습할 수 있도록 2020년에 자사에서 개발한 기존의 AI 모델을 다시 학습시켰다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!