Sam Altman: This is what I learned from DALL-E 2

오픈AI CEO ‘샘 올트먼’ 인터뷰: 내가 DALL-E 2에서 배운 것

혁신적인 AI 생성 모델 DALL-E 2는 오픈 AI의 CEO에게 3가지의 교훈을 남겼다.

오픈AI(OpenAI)의 CEO 샘 올트먼(Sam Altman)은 2015년 일론 머스크(Elon Musk) 등과 공동 창업한 이후 샌프란시스코 IT 업계에서 중심적 역할을 해왔다. 인공지능(AI)의 미래와 그곳에 도달하기 위한 방법에 대한 올트먼의 비전은 오픈AI는 물론 전체 AI 연구의 방향성을 제시하고 있다. 오픈AI는 2020년 GPT-3의 출시로 대규모 언어 모델의 시대를 열고 2022년 이미지 생성 모델 DALL-E 2를 출시하며 AI 업계에 다시 한번 강력한 파장을 일으켰다.

DALL-E 2는 지난 4월에 나오지 마자 미술, 패션, 건축, 마케팅에 이르기까지 전 업계에 걸쳐 창작성과 혁신성을 폭발시켰고, 지금도 여전히 위력을 발휘하는 중이다. DALL-E 2에 이어 다른 생성형 AI 모델들도 출시되었다. 이 가운데 일부는 개선된 성능을 보였고, 일부는 무료이거나 쉽게 이용할 수 있다. 그러나 모든 것의 시작은 DALL-E 2였다. DALL-E가 처음 공개된 이후 1년 만에 나온 DALL-E 2의 능력은 모두에게 놀라움을 주었다. DALL-E 2는 AI 업계뿐만 아니라 주류 사회와 문화에 영향을 남기게 될 것이다. 그러나 올트먼이 이미 인정했듯이 긍정적인 측면만 있는 것은 아니다.

MIT 테크놀로지 리뷰는 오픈AI의 CEO 올트먼이 DALL-E 2에서 무엇을 배웠는지를 주제로 인터뷰를 진행했다. 그는 “DALL-E 2로부터 AI의 향후 10년의 미래에 대한 중요한 교훈을 얻었다”라고 말했다.  

인터뷰는 명확성과 분량 조절을 위한 편집을 거쳤다. 이제 샘 올트먼의 말을 들어보자:

Q1. 왜 DALL-E 2가 큰 영향을 미쳤다고 생각하나?

DALL-E 2는 기존 생성형 AI 모델이 마주하던 기술적 한계를 넘어 실제 사진 같은 이미지를 제작할 수 있다. 심지어 사진 같지 않은 이미지들을 생성할 때도 DALL-E 2가 새로운 방식으로 여러 요소를 결합하는 방식을 잘 이해하고 있다고 생각된다. 그것은 마치 인간의 지능처럼 느껴진다. 기존의 DALL-E 1에서는 불가능했던 작업이다.

그렇지만 기술 커뮤니티는 DALL-E보다 2020년에 출시된 GPT-3에 더 주목했다. 사람들은 GPT-3를 통해 컴퓨터의 지능을 처음으로 느꼈다. GPT-3를 인간의 행동과 다를 바 없다고 여겼다. 나는 그래서 과거에 일반인공지능(artificial general intelligence)의 가능성을 불신했던 기술 업계의 사람들도 진지하게 이 기술을 받아들일 수 있었다고 본다. 누구도 예상치 못했던 일이 벌어지고 있었다.

그럼에도 불구하고 이미지는 감정을 전달하는 강력한 힘을 가지고 있다. 기술 커뮤니티 밖에서는 GPT-3보다 DALL-E가 더 관심을 끌었던 이유다.

Q2. DALL-E 2의 성공에서 얻은 교훈은 무엇인가?

나는 DALL-E 2에서 AI의 향후 10년의 미래에 대한 중요한 교훈을 얻었다. DALL-E 2는 오픈AI의 본사 건물에 모여 앉은 3명의 팀원이 구상했던 아이디어에서 시작되었다. 

알고리즘 개발의 돌파구가 된 것은 바로 확산 모델(diffusion models)의 적용이었다. 이 아이디어는 우리가 개발하고 있던 시시한 것들을 세상에 엄청난 영향을 주는 무언가로 완전히 뒤바꿔 놓았다.

또 다른 흥미로운 사실은 DALL-E 2는 모두가 사용할 수 있는 첫 번째 AI라는 것이다. 여기에는 몇 가지 이유가 있지만 무엇보다 이 AI가 완성도 높은 결과물을 만들어내기 때문이다. 예를 들어 프로그램 코드를 작성해 주는 AI 코파일럿(Copilot)의 경우 사용자의 개입이 많이 필요하다. 그러나 DALL-E 2를 이용한다면 마치 그래픽 예술가와 대화를 나누듯이 무엇을 원하는지만 말하면 된다. 과거의 AI에는 없었던 방식이다. 

Q3. DALL-E가 사회에 의미하는 바는 무엇인가?

오픈AI는 DALL-E 2가 크게 성공하리라고 예감했었고, 신기술을 보급하는 좋은 사례를 보여주기를 원했다. 구체적으로 설명하자면, 전 세계의 사람들이 어떤 이미지들은 가짜일 수도 있음을 깨닫고, “이봐, 인터넷에 올려진 모든 이미지가 진짜라고 믿으면 안 된다는 점을 빨리 알 필요가 있어”라고 말하기를 바랐다. 

또한 우리는 DALL-E 2의 확산으로 가장 부정적인 영향을 받게 될 사람들과 먼저 대화를 나누고, 그들이 DALL-E 2를 사용하게 하고 싶었다. 그것은 현재 가능한 틀(Framework)은 아니겠지만, 우리가 이렇게 하나의 기술 분야를 개척함으로써 도달하길 원하는 세상일 것이다. 즉, 만약 누군가가 데이터를 제공하고, AI를 훈련시키는 것을 돕고 있다면, 어떻게든 그 모델의 일부를 소유해야 한다는 것이다.

그러나 이 모든 과정은 투명하게 진행되어야 한다. DALL-E 2는 일러스트레이터들의 고용 시장에 영향을 미치게 될 것이다. 일러스트레이터 한 명이 처리하는 업무량은 10배 또는 100배로 늘어날 수 있다. 정확히 어떤 영향을 미치게 될지는 예견하기는 어렵다. 솔직히 말하면 나도 잘 모른다. 일러스트레이터 고용 시장의 규모는 증가할 수도, 또는 축소될 수도 있다. 물론 DALL-E 2와 같은 도구들을 사용하는 새로운 일자리가 생겨날 것은 명백하다. 그러나 과도기 또한 거치게 될 것이다. 

그와 동시에 DALL-E 2를 통해서 모든 사람들이 새로운 역량을 얻게 되게 되므로 엄청난 사회적 혜택이 생겨난다. 나는 DALL-E 2를 여러 용도들로 사용했다. 미술 작품을 만들어서 집 내부를 장식했고, 건축 아이디어를 얻어 집을 리모델링하는데도 꽤 성공적으로 활용했다.

내 친구들 몇 명은 곧 결혼식을 올릴 예정이다. 결혼식을 알리기 위한 웹사이트들의 모든 요소들이 DALL-E에서 생성된 이미지들로 만들어졌다. 이것은 친구들에게도 의미가 크다. 웹사이트들의 제작을 위해 일러스트레이터를 고용할 필요가 없을 테니까.  

마지막으로, 우리는 사람들에게 우리가 진짜 뭔가 하리라는 것을 알려 주기 위해서 DALL-E 2를 쓰길 바랐다. 앞으로 인간처럼 세상을 이해하고, 인간이 하는 그런 유용한 일을 할 수 있는 강력한 AI를 만들 것이다. 우리는 사람들에게 어떤 미래가 오는지 알려주고 싶고, 그래서 매우 어려운 사회적 대화에도 참여할 수 있을 것이다.

미리보기 2회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.