Unlimited computer fractals can help train AI to see

프렉털이 인공지능을 가르친다

지난 10년 간 AI의 인식 능력을 훈련시킨 이미지넷 같은 대규모 데이터세트는 구축이 어렵고 편향성의 위험도 크다. 컴퓨터 합성 데이터세트가 대안이 될 수 있다.

이미지 인식 시스템의 훈련에는 주로 뱀, 음료수, 신발 등 일상의 사물을 보여주는 수백만 장의 사진이 저장된 대규모 데이터세트가 활용된다. AI는 이런 이미지를 반복적으로 학습함으로써 사물을 구분하는 법을 배운다. 그런데 컴퓨터로 합성한 프랙털(fractal) 이미지를 활용하여 AI가 일상적인 사물을 인식하게 할 수 있다는 주장이 일본에서 나왔다.

기이하게 들리기는 하지만, 만약 사실이라면 일대 혁신이 일어날 수도 있다. 훈련 데이터 자동 생성은 현재 머신러닝에서 가장 각광 받는 주제다. 인터넷에서 수집한 이미지가 아니라 합성된 이미지를 무제한으로 이용할 수 있다면 수작업으로 구축된 기존 데이터세트 이용에 따르는 문제들도 피해갈 수 있다.

AI 훈련의 문제

사전훈련(pretraining)은 AI가 전문 데이터를 활용한 훈련을 시작하기에 앞서 몇 가지 기초 기술을 익히는 단계다. 이 단계를 거쳐 더 많은 이들이 강력한 성능을 갖춘 AI를 사용할 수 있게 된다. 훈련을 ‘제로’에서 시작하는 것이 아니라 어느 정도 기반이 닦인 상태에서 각자 필요에 맞게 조정할 수 있기 때문이다. 예를 들어, 의료용 스캔 이미지 진단 시스템은 사전훈련 단계에서 일상 사물 사진이 1,400만 장 넘게 저장된 이미지넷 같은 데이터베이스를 활용해 형태, 외곽선 등 기본적 시각 정보를 구분하는 법을 배운다. 다음 단계에서 규모는 작지만 의료 이미지로만 구성된 데이터베이스를 추가 학습해 미세한 질병의 징후까지 인식하는 능력을 갖추게 된다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!