These virtual robot arms get smarter by training each other

서로 가르치며 배우는 인공지능 가상 로봇 팔

오픈AI는 인공지능이 서로 상대방을 이기려 경쟁하는 게임을 하게 함으로써, 재훈련 없이도 다양한 문제를 해결하는 법을 학습할 수 있는 로봇을 만들려 한다.

블록 쌓기, 테이블 정리, 체스 말 배열 등 다양한 임무를 해결하는 법을 터득한 가상 로봇 팔이 나왔다. 각각의 과제 수행을 위해 다시 훈련을 받을 필요도 없다. 다른 로봇 팔이 계속 보다 어려운 과제를 주어 수행하도록 하는 방식으로 이 로봇 팔을 훈련시켰다.

자기와의 대결(Self play) : 오픈AI 연구진이 개발한 쌍둥이 로봇 팔, 앨리스와 밥은 사람이 따로 데이터를 입력하지 않아도 시뮬레이션으로 서로 게임을 하며 학습한다. 이들은 특정 목표를 달성하기 위해 어떤 상황에서 어떤 행동을 해야 하는지 시행착오를 통해 훈련하는 강화학습(Reinforcement Learning) 기술을 활용했다. 로봇들은 가상 테이블 위에 있는 물체를 움직이는 작업 등이 포함된 게임을 했다. 앨리스는 특정 방식으로 사물을 배열해 가며 밥이 해결하기 어려운 퍼즐을 낸다. 밥은 앨리스가 낸 퍼즐을 해결한다. 학습이 진행됨에 따라 앨리스는 더 복잡한 퍼즐을 내고, 밥은 점점 더 퍼즐을 잘 풀게 된다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!