Unlimited computer fractals can help train AI to see

프렉털이 인공지능을 가르친다

지난 10년 간 AI의 인식 능력을 훈련시킨 이미지넷 같은 대규모 데이터세트는 구축이 어렵고 편향성의 위험도 크다. 컴퓨터 합성 데이터세트가 대안이 될 수 있다.

이미지 인식 시스템의 훈련에는 주로 뱀, 음료수, 신발 등 일상의 사물을 보여주는 수백만 장의 사진이 저장된 대규모 데이터세트가 활용된다. AI는 이런 이미지를 반복적으로 학습함으로써 사물을 구분하는 법을 배운다. 그런데 컴퓨터로 합성한 프랙털(fractal) 이미지를 활용하여 AI가 일상적인 사물을 인식하게 할 수 있다는 주장이 일본에서 나왔다.

기이하게 들리기는 하지만, 만약 사실이라면 일대 혁신이 일어날 수도 있다. 훈련 데이터 자동 생성은 현재 머신러닝에서 가장 각광 받는 주제다. 인터넷에서 수집한 이미지가 아니라 합성된 이미지를 무제한으로 이용할 수 있다면 수작업으로 구축된 기존 데이터세트 이용에 따르는 문제들도 피해갈 수 있다.

AI 훈련의 문제

사전훈련(pretraining)은 AI가 전문 데이터를 활용한 훈련을 시작하기에 앞서 몇 가지 기초 기술을 익히는 단계다. 이 단계를 거쳐 더 많은 이들이 강력한 성능을 갖춘 AI를 사용할 수 있게 된다. 훈련을 ‘제로’에서 시작하는 것이 아니라 어느 정도 기반이 닦인 상태에서 각자 필요에 맞게 조정할 수 있기 때문이다. 예를 들어, 의료용 스캔 이미지 진단 시스템은 사전훈련 단계에서 일상 사물 사진이 1,400만 장 넘게 저장된 이미지넷 같은 데이터베이스를 활용해 형태, 외곽선 등 기본적 시각 정보를 구분하는 법을 배운다. 다음 단계에서 규모는 작지만 의료 이미지로만 구성된 데이터베이스를 추가 학습해 미세한 질병의 징후까지 인식하는 능력을 갖추게 된다.

문제는 이미지넷 같은 데이터세트를 수작업으로 구축하는 데에 시간과 노력이 많이 든다는 점이다. 이미지 라벨링 작업을 주로 저임금 크라우드 노동자(crowdworker)가 수행한다는 점도 문제다. 영상에 찍힌 사람의 동의를 받지 않고 이미지가 사용될 수도 있다. 데이터세트에 성차별 또는 인종차별을 조장하는 라벨이 포함되어 AI가 편향성을 띄게 될 수도 있다. 사전훈련 단계에서도 이 같은 편향성이 주입될 수 있다.

자연에서 힌트를 얻다

프랙털 구조는 나무에서 꽃, 구름, 파도에 이르는 모든 사물에서 발견되는 구조이다. 일본 국립고등산업과학기술원(AIST: National Institute of Advanced Industrial Science and Technology), 도쿄공업대학교(Tokyo Institute of Technology), 도쿄전기대학교(Tokyo Denki University) 소속 연구원들은 이 점에 착안, 실제 사물 사진 대신 프랙털 구조를 활용하여 자동화된 시스템에 이미지 인식의 기초를 가르칠 방법을 찾았다.

이들은 셀 수 없이 많은 컴퓨터 합성 프랙털 구조가 저장된 데이터세트를 구축하고, 여기에 프랙털DB(FractalDB)라는 이름을 붙였다. 데이터세트에 저장된 나뭇잎, 눈송이, 달팽이 껍질 등 다양한 모양의 프랙털 구조는 패턴이 비슷한 것끼리 자동으로 분류되고 라벨이 생성된다. 이들은 이미지 인식 시스템에 주로 사용되는 딥러닝 모델인 합성곱신경망(aconvolutional neural network)을 훈련하는 과정에서 실제 영상을 활용한 훈련에 들어가기 전, 사전훈련 단계에 프랙털DB를 도입했다. 그 결과 신경망이 이미지넷, 플레이시스(Places) 같은 최첨단 데이터세트로 훈련한 모델과 거의 동등한 성능을 발휘한다는 것을 발견했다. 플레이시스는 약 250만장의 실외 이미지가 저장된 데이터세트이다.

성공 가능성은?

그러나 앨라배마주 오번 대학교(Auburn University)의 안 누엔(Anh Nguyen)은 프랙털DB가 이미지넷 같은 데이터베이스에 비할 바는 아니라는 입장이다. 그는 이번 연구에 참여하지 않았으며, 추상적 패턴이 이미지 인식 시스템에 초래하는 혼동을 주로 연구한다. 누엔은 “이번 연구와 인공지능을 속인 다른 사례들 사이에는 연관성이 있다”고 지적한다. 그는 이 새로운 접근법이 어떤 식으로 작동하게 될지 자세히 들여다볼 계획이다. 반면 이번 연구에 참여한 일본 학자들은 접근법을 보완하면 프랙털DB 같은 컴퓨터 합성 데이터세트가 기존 데이터세트를 대체할 수 있다는 입장이다.

왜 프랙털인가

이번 연구에 참여한 학자들은 점박이 패턴을 생성하는 펄린(Perlin) 노이즈 및 컴퓨터 그래픽에 사용되는 베지어(Bezier) 곡선을 활용하여 생성한 다른 추상적인 이미지도 훈련에 사용했다. 그렇지만 프랙털 구조로 훈련했을 때 최상의 결과를 얻을 수 있었다. 논문의 주저자인 AIST의 히로카츠 카타오카(Hirokatsu Kataoka)는 “프랙털은 우리가 사는 세계 어디에나 존재하는 구조”라고 강조한다.

미리보기 3회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.