fbpx
“Copyright traps” could tell writers if an AI has scraped their work

함정 놓아 AI 모델의 저작물 무단 사용 잡는 새로운 ‘툴’ 등장

AI 모델 훈련에 저작권이 있는 콘텐츠가 무단 사용되는 문제를 둘러싼 논란이 끊이지 않고 있지만, 콘텐츠 제작자들이 그런 무단 사용 여부를 증명하기가 여간 어렵지 않았다. 하지만 이제 이들의 수고를 크게 덜어줄 새로운 도구가 등장했다.

생성형 AI가 유행하기 시작한 이래로 콘텐츠 제작자들은 자신의 저작물이 동의 없이 수집되어 AI 모델 학습에 사용되고 있다고 주장해 왔다. 그러나 이전까지는 특정 텍스트가 실제로 AI의 학습 데이터 세트에 사용되었는지 알아내기가 어려웠다.

이제 이를 증명할 수 있는 새로운 방법이 등장했다. 임페리얼 칼리지 런던 연구팀이 개발한 ‘저작권 트랩(copyright trap)’이 바로 그 새로운 방법이다. 저작권 트랩은 저자와 출판사가 자신들의 저작물에 은밀한 표시를 남겨서 나중에 저작물이 AI 모델에 사용되었는지 확인할 수 있도록 도와주는 숨겨진 텍스트 조각을 말한다. 이 방식은 지도에 가짜 위치를 남기거나 사전에 가짜 단어를 포함하는 전략 등 예전부터 저작권 소유자가 사용해 왔던 각종 트랩(함정)과 유사하다.

이러한 AI 저작권 트랩은 AI 분야의 가장 큰 싸움에서도 활용될 수 있을 것이다. 현재 수많은 출판사와 저자들은 자신들의 지식재산이 허락 없이 AI 학습 데이터 세트에 수집되었다고 주장하며 기술 기업들을 상대로 소송을 진행하고 있다. 그중에서 아마도 오픈AI를 상대로 소송을 진행하고 있는 뉴욕타임스의 사례가 가장 유명할 것이다.

저작권 트랩을 생성하고 탐지할 수 있는 코드는 현재 프로그래머를 위한 소셜 코딩 공간인 깃허브(GitHub)에서 사용할 수 있지만, 연구팀은 사람들이 직접 저작권 트랩을 생성하고 삽입할 수 있는 도구도 개발할 계획이다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!