구글, 음악 한 소절 듣고 다음 소절 창작하는 오디오 생성 AI 공개

구글이 새로 선보인 AI 시스템인 ‘오디오LM(AudioLM)’에 짧은 음성이나 음악을 들려주면 나머지 부분이 자연스럽게 이어지도록 완성해준다.

2022년 10월 17일

최근 사람 목소리나 음악을 몇 초간 들려주면 뒤에 자연스럽게 이어지는 소리를 만들어주는 인공지능(AI)이 공개됐다. 구글에서 개발한 ‘오디오LM(AudioLM)’가 그 주인공이다.

오디오LM은 피아노곡처럼 복잡한 소리와 사람의 음성 등 프롬프트 스타일에 맞는 소리를 원래 녹음 데이터와 거의 구분하기 힘든 수준으로 생성해주는 기술이다. 이는 오디오 생성을 위한 AI의 학습 속도를 개선해줄 수 있는 기술로 평가되며, 종국적으로는 향후 동영상 배경음악을 자동으로 생성하는 데 활용할 수 있을 전망이다.

(모든 예시를 여기서 들을 수 있다.)

사실 이러한 ‘AI 생성 오디오(AI-generated audio)’는 보편화되어 있다. 자연어 처리 기법을 활용하는 아마존의 알렉사(Alexa)가 내는 음성이 대표적이다. 오픈AI(OpenAI)의 주크박스(Jukebox) 같은 AI 음악 시스템도 이미 인상적인 결과를 생성해 냈다. 그러나 대부분의 기존 AI 기술에겐 시간과 수고가 많이 드는 스크립트를 준비하거나 텍스트 기반 학습 데이터에 레이블을 붙여줄 사람이 필요하다. 일례로 주크박스는 텍스트 기반 데이터를 이용해서 노래 가사를 생성한다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!

구글, 음악 한 소절 듣고 다음 소절 창작하는 오디오 생성 AI 공개

개인정보 수집 및 이용

인기 기사

구글, 음악 한 소절 듣고 다음 소절 창작하는 오디오 생성 AI 공개

MIT Technology Review 뉴스레터 구독

가장 빠르게, 가장 편하게 MIT Technology Review의 최신 컨텐츠를 받아 보세요.

개인정보 수집 및 이용

인기 기사

연관 토픽

미국이 이스라엘, 우크라이나, 대만에 지원하는 방산 기술은 이것이다

챗봇이 내놓은 답변의 신뢰도를 평가하는 새로운 도구가 나왔다

[인터뷰] 김종원 GIST 슈퍼컴퓨터센터장, “AI 연구에 삽 대신 포크레인이 필요하다”

[인터뷰] 샘 올트먼 “유용한 에이전트가 AI의 킬러 기능 될 것”