OpenAI is ready to sell DALL-E to its first million customers

오픈AI, DALL-E 판매할 준비를 마치다

오픈AI가 첫 번째 유료 고객 수백만 명에게 자사의 이미지 생성 모델 DALL-E를 판매할 준비를 마쳤다. 오픈AI는 이번 출시를 위해 DALL-E가 가진 결점들을 서둘러 수정해야 했다.

미국 샌프란시스코에 본사를 둔 인공지능 기업 오픈AI(OpenAI)가 대기자 명단에 있는 100만 명의 고객들에게 자사의 이미지 생성 프로그램 DALL-E 2를 판매할 예정인 것으로 MIT 테크놀로지 리뷰 취재 결과 확인됐다.

DALL-E 2는 지난 4월 초대받은 사람들만 사용할 수 있도록 공개됐고 그 이후로 약 10만 명의 이용자가 DALL-E 2를 사용했다. 이제 오픈AI는 DALL-E 2를 유료 서비스로 전환하면서 그보다 10배 많은 100만 명에게 서비스를 공개할 예정이다.

오픈AI의 제품 및 파트너십 담당 부사장 피터 웰린더(Peter Welinder)는 “우리가 예상했던 것보다 DALL-E 2에 대한 사람들의 관심이 높고, GPT-3보다도 훨씬 큰 관심을 끌고 있다”고 말했다.

유료 고객들은 이제 DALL-E가 생성한 이미지를 상업적인 용도로 사용할 수 있다. 예를 들어 아동도서의 삽화, 영화와 게임의 컨셉아트나 마케팅 브로슈어에도 이미지를 사용할 수 있다. 그러나 이번 DALL-E 2 출시는 오픈AI가 선호하는 제품 출시 방식에 대한 가장 큰 시험대가 될 전망이다. 오픈AI가 선호하는 방식이란 고객들에게 강력한 AI를 단계적으로 공개하고 문제가 발생할 때마다 해결하는 방식을 뜻한다.

DALL-E 베타 구독에 매우 큰돈이 들지는 않을 것으로 보인다. 15달러면 115크레딧을 구매할 수 있는데, 크레딧 하나당 이미지 생성을 위한 지시사항(텍스트 프롬프트) 하나를 제출할 수 있고 프롬프트 하나당 한 번에 이미지 네 개가 생성된다. 다시 말해서 15달러에 460개의 이미지를 만들 수 있다. 이뿐만 아니라 이용자는 첫 달에 무료 크레딧 50개, 그 다음 달에 무료 크레딧 15개를 각각 제공받는다. 물론 최고의 이미지를 생성하기 위해 한 번에 이미지를 수십 장씩 만드는 이용자 같은 파워유저(power user)들은 그 정도 무료 크레딧은 금방 소진할지도 모른다.

각종 문제 해결

이번 제품 출시를 준비하는 과정에서 오픈AI는 제품을 처음 사용해본 얼리어답터들과 협력하여 DALL-E 2의 문제점을 해결했다. 이용자들은 처음에 초현실적이고 인상적인 이미지를 꾸준히 만들어냈다. 그러한 이미지에는 귀여운 동물들을 이리저리 섞은 그림, 으스스할 정도의 정확도로 실제 사진작가들의 스타일을 모방한 사진, 레스토랑 무드보드(mood board)와 스니커즈 디자인 등이 있다. 이를 통해 오픈AI는 DALL-E 2의 강점과 약점을 파악할 수 있었다. 오픈AI의 제품 매니저 조앤 장(Joanne Jang)은 “이용자들은 우리에게 엄청난 양의 정말 훌륭한 피드백을 줬다”고 말했다.

오픈AI는 이미 이용자가 생성할 수 있는 이미지의 종류를 통제하는 단계를 거쳤다. 예를 들어 사람들은 유명인을 포함한 이미지를 생성할 수 없다. 이번 상업용 출시를 준비하면서 오픈AI는 초기 이용자들이 파악했던 또 다른 문제도 해결했다. 4월에 출시한 DALL-E 버전은 때때로 인종이나 젠더 편향이 담긴 이미지를 생성하곤 했다. 예를 들어 CEO와 소방관은 모두 백인 남성 이미지로, 선생님과 간호사는 모두 백인 여성 이미지로 생성하는 식이었다. 오픈AI는 이번에 이 문제도 해결했다.

7월 18일 오픈AI는 이러한 문제를 해결한 수정판을 발표했다. 이제 DALL-E 2는 이용자가 사람이 여럿 담긴 이미지 생성을 요청하면 오픈AI가 글로벌 다양성을 더 대변한다고 주장하는 샘플 데이터세트를 사용한다. 오픈AI의 자체적인 테스트에 따르면 이 시스템을 도입한 이후 이용자들이 DALL-E 2의 결과물에 다양한 배경을 가진 사람들이 포함됐다고 보고할 가능성이 12배 더 높았다고 한다.

이는 꼭 필요한 수정이었지만 다소 피상적인 방식을 사용한 것으로 보인다. 오픈AI는 사람들이 요청할 수 있는 내용을 필터링하거나 모델이 생성하는 이미지를 검열하는 방식으로 이용자들이 보고한 문제점 대부분을 해결한다. 그러나 이러한 방식은 모델 자체나 모델이 학습한 학습 데이터 자체에서 문제를 해결한 것이 아니다. 지금과 같은 방식으로 문제를 해결하면 오픈AI는 더 빠르게 문제를 해결할 수 있지만 어떤 사람들에게는 이들의 방식이 마치 문제가 있는 부분에 단순히 반창고를 붙이는 것처럼 느껴질 수도 있다.

튜링 연구소(Turing Institute)에서 데이터과학과 인공지능(AI) 분야의 젠더 문제를 연구하는 런던 정치경제대학교 소속 주디 와이즈먼(Judy Wajcman)은 “알고리즘에 존재하는 사회적 편향 문제는 엄청나다”며 “기술적인 수정을 위해서는 엄청난 에너지가 투입되어야 하므로 나는 그들의 모든 노력을 높이 평가하지만 그렇다고 그들의 노력이 문제에 대한 장기적인 해결책이라고 할 수는 없다”고 말했다.

오픈AI는 DALL-E 2의 성별 및 인종 편향 문제를 해결하면서 제품을 완전히 출시할 자신감을 얻었다고 말했다. 그러나 이것이 완전한 해결이라고는 할 수 없을 것이다. AI의 편향은 치명적이고 해결하기 어려운 문제이며 오픈AI는 새로운 사례가 생겨날 때마다 마치 두더지 잡기 게임처럼 계속해서 문제를 하나씩 해결해야 할 것이다. 오픈AI는 제품에 수정이 필요할 때마다 제품 공개를 중단하겠다고 말했다.

웰린더는 이러한 방식이 균형을 잡기 위한 것이라고 설명했다. 문제가 생길 때마다 조금씩 제품을 수정하는 방식을 이용하면 때때로 이용자들이 예상치 못한 방법으로 만들어내는 것들을 억제할 수 있다는 것이다. 예를 들어 오픈AI가 처음 젠더 편향을 수정한 버전을 공개했을 때 일부 이용자들은 계속해서 여성 슈퍼마리오가 만들어진다고 불평했다. 웰린더는 “그런 사례는 예측하기 어렵다”며 “사람들이 프로그램을 이용해서 무엇을 만들려고 시도하는지 관찰하면 우리가 프로그램을 미세하게 조정하고 교정하는 데 도움이 된다”고 말했다.

그러나 수백만 명이 넘는 이용자들이 생성하는 수억 개의 이미지를 모니터링하는 것은 방대한 작업이 될 것이다. 웰린더는 이 작업을 수행하는 데 얼마나 많은 인력이 필요할지는 언급하지 않았지만 아마도 사내 직원들이 작업을 담당하게 될 것이라고 밝혔다. 오픈AI는 조정(moderation) 작업에 자동화된 검사와 인간의 판단을 혼합하는 하이브리드 접근법을 사용한다. 웰린더는 필요에 따라 더 많은 인력을 고용하거나 인간과 기계의 개입과 관련한 균형을 조정하여 팀의 구성을 맞출 수 있다고 밝혔다.

5월 구글은 이매젠(Imagen)이라는 명칭의 자체적인 이미지 생성 AI를 공개했다. 오픈AI와 달리 구글은 이미지 생성 기술에 관해 어떤 계획을 가지고 있는지 거의 언급하지 않았다. 구글의 대변인 브라이언 가브리엘(Brian Gabriel)은 “우리는 아직 이매젠에 관해 새로 공유할 것이 없다”고 말했다.

2015년 설립 당시 오픈AI는 인공일반지능(artificial general intelligence)에 대한 믿음과 기술이 인류를 이롭게 할 것이라는 확신을 가진 순수한 연구소로 등장했다. 그러나 최근 몇 년 동안 오픈AI는 자사의 강력한 AI 제품을 유료 고객들에게 제공하는 제품 회사가 되었다.

웰린더는 오픈AI의 최근 행보 역시 설립 당시 비전의 일부라며, “우리 기술을 제품에 적용해서 규모에 맞게 구현하는 것은 우리 미션에서 매우 중요한 부분이다. 조기에 아직 위험성이 낮을 때 반복을 통해 기술의 유용성과 안전성을 파악하는 것이 중요하다”고 밝혔다.

미리보기 3회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.