fbpx
AI companies are finally being forced to cough up for training data

AI 기업, 이제 학습 데이터에 막대한 대가 지불하게 됐다

AI 음악 스타트업들은 최근 대형 음반사들이 제기한 소송을 통해 양질의 학습 데이터는 공짜가 아니라는 교훈을 비싼 대가를 치르고 깨닫고 있다.

전 세계를 휩쓴 생성형 인공지능(AI)을 움직이는 힘은 막대한 양의 데이터이다. 더 많은 학습 데이터를 확보할수록 AI 모델의 성능도 더 강력해진다.

하지만 문제가 생겼다. AI 기업들이 인터넷을 뒤져 학습 데이터를 쓸어가자 많은 웹사이트와 데이터 세트 소유자들은 웹사이트를 스크랩하는 기능을 제한하기 시작한 것이다. 최근에는 AI 업계에서 무차별적으로 온라인 데이터를 스크랩하는 관행에 대해 사용자들이 자신의 데이터를 학습용으로 제공하는 것을 거부하기 시작했고, 아티스트, 작가, <뉴욕타임스> 등은 동의나 보상 없이 지적 재산을 탈취한 혐의로 AI 업체들을 상대로 소송을 제기하는 등 거센 반발도 나타나고 있다.

최근 주요 음반사인 소니 뮤직, 워너 뮤직 그룹, 유니버설 뮤직 그룹은 저작권 침해 혐의로 AI 음악 기업인 수노(Suno)와 유디오(Udio)를 고소한다고 발표했다. 음반사들은 이 두 기업이 거의 상상할 수 없는 규모로 저작권이 있는 음악을 학습 데이터에 사용해 AI 모델이 실제 인간 음원의 품질을 모방한 노래를 생성하도록 했다고 주장했다. 필자의 동료인 제임스 오도넬(James O’Donnell)은 최근 MIT 테크놀로지 기사를 통해 이 소송의 주요 쟁점들을 상세히 분석하고 이러한 소송이 AI 음악의 미래를 결정할 수 있다고 예측했다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!