fbpx
How this grassroots effort could make AI voices more diverse

AI 음성의 편향성 깨겠다…커먼보이스 프로젝트의 야심 찬 도전

현재 음성 AI는 주로 백인 미국인의 영어에 기반하기 때문에 전 세계의 다양한 언어와 억양을 충분히 반영하지 못하고 있다. 이런 문제점을 극복하고자 비영리재단 모질라가 180여 개 언어의 음성 데이터를 수집하며 AI 언어의 다양성과 투명성을 강화하려는 프로젝트를 추진하고 있다.

애플과 오픈AI와 같은 기술 기업들이 차세대 인공지능(AI) 비서 기능을 출시하면서 음성 AI 붐이 일고 있다. 그러나 AI 비서의 기본 음성은 백인 미국인(운이 좋으면 영국인)의 음성인 경우가 많으며 대부분 영어를 사용한다. 이러한 백인 미국인의 영어는 다양한 지역과 문화에 걸쳐 있는 영어의 수많은 방언과 억양 중에서도 극히 일부에만 해당될 뿐이다. 게다가 이로 인해 영어를 사용하지 않는 나머지 수십억 명의 사람들은 AI 비서를 제대로 이용할 수 없다. AI 비서는 영어 외에 다른 언어에서는 제대로 작동하지 않을 수 있기 때문이다.

이러한 문제가 발생하는 이유는 모델을 학습시키는 데 사용하는 데이터가 제한적이기 때문이다. AI 연구에서 모델 학습에 사용하는 대부분의 데이터는 영미권 문화를 반영하는 인터넷의 영어 자료에서 추출한다. 그러나 이러한 현재 상황을 바꾸고 AI 음성의 투명성과 다양성을 개선하기 위한 대규모 프로젝트가 진행되고 있다. 바로 소프트웨어 분야의 비영리 재단인 모질라(Mozilla)에서 추진하고 있는 ‘커먼보이스(Common Voice) 프로젝트’이다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!