
Stephanie Arnett/MIT Technology Review | Adobe Stock
Humanoid data
휴머노이드 로봇 데이터
로봇 기업들은 우리가 손과 팔다리를 어떻게 움직이는지에 대한 방대한 양의 데이터를 원하고 있으며, 이를 얻기 위한 그들의 수법은 점점 기이해지고 있다.
최근 필자는 그릇에 음식을 담고 전자레인지에 돌린 뒤 꺼내는 등의 작업을 하는 모습을 촬영하면 암호화폐를 지급해 주는 앱에 참여해 보라는 제안을 받았다. 또 다른 웹사이트로부터는 중국 선전에 있는 로봇 팔을 원격으로 조종해 퍼즐과 과제를 수행해 로봇의 손재주를 향상시키는 새로운 게임을 해보라는 권유도 받았다.
도대체 무슨 일이 벌어지고 있는 걸까? 우리가 하는 말이 대형언어모델(LLM)의 훈련 데이터가 되었듯, 이제 로봇 기업들은 인간의 움직임에 관한 데이터가 더 정교한 휴머노이드 로봇을 만드는 데 도움이 될 것이라고 보고 있다. 휴머노이드는 단순한 로봇 팔보다 훈련이 훨씬 까다롭지만, 로봇 기업들은 그것을 인간이 일하는 환경에 더 쉽게 투입할 수 있고, 언젠가는 인간의 노동을 완전히 대체할 수 있다고 보고 있다.
이 같은 휴머노이드 훈련 방식은 2022년 챗GPT 출시 이후 본격화됐다고 볼 수 있다. LLM은 방대한 텍스트 데이터에 노출되면서 성능을 끌어올렸고, 로봇 공학자들도 이러한 ‘확장 법칙’을 로봇에 적용하고자 했다. 그러나 인간의 움직임을 설명하는 인터넷 규모의 데이터는 존재하지 않았다.
데이터 수집의 어려움 때문에 기업들은 가상 시뮬레이션을 활용하는 우회적 방법을 택했다. 하지만 시뮬레이션은 마찰이나 탄성과 같은 물리적 요소를 현실처럼 완벽하게 구현하지 못해, 이 환경에서 학습한 로봇은 실제 상황에서 제대로 작동하지 못하는 경우가 많았다.