이미지 생성(Generative) AI

간단한 설명문으로 아름다운 이미지를 만들어내는 AI 모델이 영향력 있고 창의적이며 상업적인 도구로 진화하고 있다.

2023년 1월 10일

주체: 오픈AI(Open AI), 스태빌리티AI(Stability AI), 미드저니(Midjourney), 구글(Google)
시기: 현재

오픈AI는 2021년에 출시한 텍스트에서 이미지를 생성(text-to-image)하는 인공지능 모델 DALL-E를 통해 이상함과 놀라움이 혼합된 세계를 선보였다. DALL-E는 이용자가 짧은 설명 문구를 텍스트로 입력하기만 하면 몇 초 안에 원하는 이미지를 만들어 낸다. 2022년 4월에 공개된 DALL-E 2는 엄청난 발전을 보였다. 구글도 이마젠(Imagen)이라는 자체 이미지 생성 AI 시스템을 개발했다.

여러 가지의 이미지 생성용 인공지능 모델들 가운데 신의 한 수라고 부를만한 모델은 바로 스테이블 디퓨전(Stable Diffusion)이다. 8월에 영국의 스타트업 스태빌리티AI가 무료로 출시한 오픈소스 기반의 텍스트-이미지 모델 스테이블 디퓨전은 가장 아름다운 이미지를 생성할 수 있을 뿐만 아니라 가정용 컴퓨터에서도 충분히 실행되도록 설계되었다.

모두가 텍스트-이미지 모델을 사용할 수 있게 함으로써 스태빌리티AI는 이미 타오르고 있었던 독창성과 혁신의 불길에 기름을 부은 셈이다. 수백만 명의 사람들이 단 몇 달 만에 수천만 개의 이미지들을 만들었다. 하지만 이 또한 문제가 있었다. 예술가들은 10년 동안 일어난 가장 큰 격변 가운데 하나에 휘말리게 되었다. 그리고 언어 모델과 마찬가지로 텍스트-이미지 생성 모델 역시 인터넷에서 대량으로 긁어온 훈련용 데이터에 포함된 편향되고 독성 있는 콘텐츠와의 연관성을 증폭시킬 수 있다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!

이미지 생성(Generative) AI

개인정보 수집 및 이용

인기 기사

이미지 생성(Generative) AI

MIT Technology Review 뉴스레터 구독

가장 빠르게 최신 콘텐츠를 받아 보세요.

개인정보 수집 및 이용

인기 기사

연관 토픽

미토스보다 현실적인 위협…메타 해킹이 드러낸 AI 보안의 맹점

AI 챗봇 사용으로 우리는 뇌의 통제력을 잃고 있을까?

변호사 대신 챗봇…AI가 바꾼 법정 풍경

혼자서 사업하기 버겁다면…소규모 사업자의 AI 활용법