Controversy arises over copyright of AI-generated images from text

텍스트를 이미지로 바꿔주는 인공지능(AI)을 둘러싼 저작권 논쟁

지난달 미국 콜로라도주가 주최한 회화 공모전에서 우승을 차지한 ‘우주 오페라 극장(Théâtre D’opéra Spatial)’이 사람이 아닌 AI가 생성한 이미지였다는 사실이 밝혀지자 논란이 들끓고 있다. 텍스트를 이미지로 전환해주는 생성기(image generator)는 수년 전에 나왔지만 왜 지금 논란이 되는 것일까?

인공지능(AI)가 그린 ‘우주 오페라 극장’        

구글 플레이(Google Play) 스토어에는 이미지를 생성해주는 앱들이 수십여 개나 올라와 있다. 그 가운데는 제이슨 앨런(Jason M. Allen)이 ‘우주 오페라 극장’을 생성하는 데 사용했던 미드저니(Midjourney)도 있다. 적대적 생성 신경망(GAN)을 활용한 이미지 생성 도구들이 널리 사용되기 시작하자 추상적 텍스트와 이미지 생성의 간격은 극적으로 좁혀졌다. 트위터에 #AIArt 또는  #midjourney  해시태그로 검색하면 멸망한 화성의 모습 등 수많은 이미지들이  발견된다. 그런데 어째서 디지털 예술가들은 앨런이 콜로라도주 회화 공모전에 제출한 이미지를 비판하고 나섰던 것일까?

                                       구글 플레이 스토어의 AI 아트 생성기(AI Art Generators)

창작자 커뮤니티의 반발   

앨런이 공모전에 제출한 ‘우주 오페라 극장’ 작품의 하단에는 ‘미드저니로 제이슨 앨런 제작(Jason M. Allen via Midjourney)’이라고 적혀 있었다. 그는 게임 디자이너였으므로 그래픽 아티스트와는 거리가 멀었다.  앨런은 미드저니에 텍스트 명령어(text prompt)를 입력하여 이미지를 생성했다. 그 이후 포토삽으로 해당 이미지의 디테일을 높이는 하이패스(high pass) 과정을 거쳤고 인물의 머리카락을 그려 넣었다. 마지막으로 해상도를 높여주는 기가픽셀 AI(Gigapixel AI)로 이미지를 출력했다. 그러나 콜로라도주 공모전의 심사위원들은 그의 출품작이 AI 프로그램으로 만들어졌다는 사실을 깨닫지 못했다고 말했다.

그가 1위를 차지했던 디지털 합성사진(Digitally-Manipulated Photography) 부문은 창작 또는 표출 과정의 일부로 디지털 기술을 사용하는 예술적 행위를 인정하고 있었다. 디지털 합성 사진 필터로 색상, 채도, 톤을 편집하거나 픽셀을 조정하거나 이미지를 재조합하는 방식도 가능하다. 심사의 공정성을 해쳤다는 비판에 대해서 앨런은 콜로라도주 회화 전시회 공모전의 규정을 모두 준수했다고 주장했고 사과할 마음은 전혀 없다고 밝혔다.

소셜 뉴스 웹사이트 레딧(Reddit)의 게시판 ‘r/ 지독히흥미로운’(r/Damnthatsinteresting)에는 과연 앨런이 미드저니에 어떤 텍스트를 입력해서  ‘우주 오페라 극장’ 이미지를 만들어 냈는가에 대한 궁금증과 냉소적 반응들이 꼬리를 물고 올라왔다.  앨런이 입력했던 텍스트는 알려진 바 없지만 미드저니가 만들어낸 비슷한 스타게이트 이미지의 생성에 사용된 텍스트는 ‘돌로 된 원 모양의 스타게이트, 영화 같은 풍경, 장대한 하늘(stargate made of stone that forms a circle, cinematic view, epic sky)’이었다.

콘셉트 아트 디자이너로 일하는 트위터 사용자 @arvaliss는 “AI 이미지 생성기가 100% 인간이 제작한 것과 구분이 안 가는 예술을 만들어내기 때문에 매우 걱정된다”고 말했다. 또 다른 사용자 @OmniMorpho는 이런 트윗을 남겼다. “우리는 예술적 기교(artistry)가 죽음을 맞는 모습을 지금 눈앞에서 보고 있다. 창조적 직업들이 ‘기계’로부터 안전하지 않다면, 더 고도의 숙련도가 필요한 직업들까지도 점차 위험해지고 구식이 되어버릴 것이다.”

창작성의 영역을 넘보는 AI

컴퓨터를 이용한 예술의 역사는 컴퓨터 과학자 헤롤드 코헨(Harold Cohen)이 최초로 AI로 그림을 그렸던 1973년으로 거슬러 올라간다. 사람들은 코헨이 제작한 거북이 모양의 드로잉 로봇(turtle robot)은 바닥에 놓인 캔버스를 지나가면서 선을 긋는 모습을 흥미롭게 지켜보았다. 그 당시 인간-기계의 협업은 초보적이었고 나름 새로운 시도로 받아들여졌다.

사용자가 입력한 텍스트를 이미지로 전환해주는 AI의 성능은 사이버펑크, 사이키델릭, 초현실적 스타일을 골라서 지정할 수도 있고 막스 에른스트, 르네 마그리트, 폴 시냑 등 유명 화가들의 창작 스타일을 적용할 수도 있다. 심지어 ‘경외감’, ‘견디는 의지’, ‘지식’에 대한 열망 등 추상적 아이디어까지 시각화할 수 있다. 분명한 점은 기계와 인간의 협력적 창작 과정에 인간의 개입이나 기여는 극적으로 줄어들었다는 사실이다.

19세기 말 사진이 예술의 영역으로 들어오자, 프랑스 시인 샤를 보들레르(Charles Baudelaire)는 사진 산업이 예술의 영역을 대체하거나 타락시킬 수 있다고 우려했다. 그는 사진 산업이 재능이 부족한 화가들의 피난처라고 혹평했다. 그렇지만 그 무렵 보들레르의 반발은 현대 사진예술 작가들에게 시대착오적 생각으로 여겨질 것이다.

예술적 스타일을 모방하는 AI

다른 예술가들로부터 영감을 받거나 차용하는 행위는 예술계의 관행으로 여겨질 수 있지만 예술가들은 AI의 기계적 모방에 거부감을 느낀다. 스웨덴 예술가 사이먼 스톨렌하그(Simon Stålenhag)의 작품은 노스탤지어와 디스토피아가 혼합된 느낌을 준다. 스칸디나비아의 들판에 외계 로봇들과 공룡들이 등장하는 그의 작품은 유명세를 얻었다.

그런데 스톨렌하그는 영국 서섹스 대학의 안드레스 과다무즈(Andres Guadamuz)가 저작권과 AI의 관계를 연구하려는 목적으로 미드저니를 이용해서 자신의 작품들을 모방했었다는 사실을 깨닫고 엄청난 공포감을 경험했다. 스톨렌하그는 저작권이 침해되었다고 주장하면서 미드저니 사용자 구아데무즈에게 소송을 제기할 수 있을까? 이 경우 스톨렌하그가 승소할 가능성은 적다. ‘예술 작품’의 복제는 저작권 침해이지만 ‘예술적 스타일’에 대한 모방은 저작권 침해는 아니기 때문이다.

게임의 법칙

1965년 독일 철학자 막스 벤제(Max Bense)는 ‘생성미학(generative aesthetics)’이라는 용어를 처음 사용했다. 그는 알고리즘 코드 또는 수학 공식을 기반으로 생성되는 작품들의 프로세스는 예술가가 정의하지만 임의성이 포함된 표현은 기계와 예술가의 협업으로 보았다. AI가 인간의 역량을 증가시키도록 훈련, 테스트, 조정을 수행한다면 인간 참여형(HIL: human in the loop) 방식이다. 반면 자동화 시스템이 행동을 주도하고 인간은 필요할 때에만 개입한다면 인간 감독형(HOL: human on the loop)  방식이다. AI 신경망 도구를 이용한 예술행위는 HOL에 점차 가까워지고 있다.

2022년 4월에 오픈 AI(Open AI)가 내놓은 DALLE-2는 자연어 표현만으로 이미지를 생성할 수 있는 기능으로 이목을 집중시켰다. 몇몇 예술가들은 이미 DALLE-2 를 사용하여 뮤직비디오와 잡지 표지를 만들고 있다. 오픈AI는 118개 국가들에 걸쳐 3,000명의 예술가들에게 DALLE-2를 미리 공개하였고 DALLE-2를 예술가들의 작업과정에 통합하도록 유도했다. 이처럼 DALLE-2는 어디까지나 인간 예술가들의 창작성을 ‘연장’하는 기능에 한정되었고 ‘도구’라는 의미가 강했다. 그런데 앨런은 AI로 생성한 이미지로 인간 예술가들과 경쟁을 펼쳤기 때문에 공정하지 못했다는 비난을 받았다.

AI 이미지 생성기에 텍스트를 골라서 입력하는 과정을 고도의 예술적 기교나 인간-기계의 창조적 협업으로 볼 수 있을까?  이런저런 비난에도 불구하고 앨런은 자신에게 저자의 자격(authorship)이 있다는 입장이다.

AI가 생성한 이미지의 저작권은 누구에게 있나?  

캘리포니아주 산타클라라에 위치한 미드저니의 이용약관(terms of use)에 따르면 유료 회원은 미드저니 봇이 생성한 자산을 소유하지만, 무료 회원의 경우는 크리에이티브 코먼스(Creative Commons) 라이선스가 적용된다. 오픈AI는 이용약관을 통해 DALLE-2로 만들어진 생성물의 소유권은 원칙적으로 오픈AI에게 있지만, 그 생성물을 사용자가 판매하거나 웹사이트 및 프레젠테이션 등에 사용할 수 있도록 권리를 부여했다. 그런데 이용 약관은 계약법에 불과하므로 AI가 생성한 이미지에 대한 ‘저작권’까지 정하지는 못한다.

한편, 미국 저작권청의 규정(copyrightable authorship)과 우리나라의 현행 저작권법은 창작자는 ‘기계’가 아니라 ‘사람'(human authorship)일 것을 요구한다. 올해 2월 미국 저작권청은 “인간의 저작자가 저작권 보호의 전제 조건”이라고 결정하고 AI가 생성한 이미지에 저작권 등록을 거부했다.  

창작성’에는 어떤 아이디어를 표현하기 위해 ‘이마의 땀(sweat of the brow)’을 흘렸기 때문에 권리를 부여한다는 사상이 깔려 있는 것이다. 그러나 알고리즘에 의한 이미지 생성은 인간의 ‘땀과 수고’와 같지 않고 ‘도구’의 사용으로 여겨진다

앨런이 미드저니에 특정 텍스트를 입력하여 전체 이미지를 생성하고, 그 후 포토샵으로 약간의 손질을 한 것은 기계의 작업인 것일까 아니면 앨런의 창작물일까? 누구든지 텍스트-이미지(text-to-image) 변환 알고리즘에 동일한 텍스트를 입력하여 같은 산출물을 얻는다면 그것은 저작권 없는 공공영역(public domain)으로 해석될 가능성이 높다. 텍스트-이미지 전환 프로그램으로 생성한 이미지를 자신의 고유한 ‘작품’이라고 생각하는 사용자에게는 뜻밖일 것이다.

인간 창작 vs기계적 알고리즘의 경계

앨런이 <뉴욕타임스>와의 인터뷰에서 밝혔던 충격적 견해는 이것이다. “예술은 죽었습니다. 끝났죠. AI가 이겼습니다 인간이 패배했죠.” AI가 창작의 영역을 잠식하면 예술가들은 독자성을 지키기 위해 어떤 선택을 하게 될까? 앞으로는 공개경쟁을 거치는 출품작에는 ‘AI가 모두 그렸음’ ‘AI와 작가의 공동 창작’  ‘모두 작가가 그렸음’을 명시해야 할지도 모른다. AI가 생성한 그림은 ‘사람’ 이름으로 출품해서는 안 되고 ‘AI 프로그램’이  50% 이상 기여한 이미지는 사람의 명의로 출품할 수 없다는 제한 규정이 생겨날 가능성도 있다.  

* 필자 최은창은 MIT 테크놀로지리뷰  한국어판 편집장이며 옥스퍼드대 법대 방문학자, 과학기술정책연구원(STEPI) 펠로우, 예일대 로스쿨 정보사회프로젝트 펠로우로서 연구했다. 저서로 《레이어 모델》과 《가짜뉴스의 고고학》, 공저로 《인공지능 권력변환과 세계정치》와 《인공지능 윤리와 거버넌스》 등이 있다.

미리보기 2회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.