fbpx

[로보틱스] “생성형 AI, 점핑 로봇을 설계하다” — MIT의 김병철 연구원

MIT의 김병철 박사 연구팀이 '디퓨전 모델'이라는 생성형 AI 기술을 활용하여 로봇의 형상을 자동 설계하는 기술을 개발했다. AI가 스스로 창의적인 형상을 만들고 최적화하면서 진화하는 새로운 로봇 설계의 방식을 고안한 것이다. 이 혁신적인 기술은 로봇뿐 아니라 드론, 자동차, 기계 부품, 가구 등 다양한 산업 분야로의 확장이 기대되고 있다.

생성형 인공지능(AI)을 이용한 설계가 최근 몇 년간 다양한 접근 방식으로 발전해왔다.

강화학습(reinforcement learning), 유전 알고리즘(genetic algorithm), 일반 그래프 최적화(general graph optimization, g2o) 등을 이용한 기존 AI 기반 설계 기법들은 길이나 각도 등의 한정된 변수로 구성되는 구조적 최적화나 기구학적 설계에는 강점을 보였다. 하지만 수많은 점이나 폴리곤을 계산해야 하는 형상(geometry) 설계에 있어서는 연산량의 기하급수적 증가라는 문제점을 안고 있다.

생성형 AI 기술의 하나인 디퓨전 모델은 지금까지 달리(DALL·E) 나 미드저니, 스테이블 디퓨전과 같은 이미지나 3D 객체, 영상 등을 생성하기 위한 기술로 알려져 왔다. 이 디퓨전 모델은 이미지나 3D 형상을 빠르게 생성할 수 있다는 장점을 갖고 있다. 그렇다면 디퓨전 모델을 형상 설계에 활용할 수 있는 방법은 없을까?

MIT 컴퓨터과학 및 인공지능 연구소(CSAIL)의 김병철 박사가 바로 이런 질문에 대한 답변으로 디퓨전 모델을 이용한 새로운 로봇 설계 방식을 제안하고 나섰다. 김 박사는 최근 복잡한 조건에 맞춰 설계하고 성능을 평가하며 최적의 로봇 형상을 자연스럽게 찾아내는 AI 기반 설계 기술을 발표했다. 김 박사 연구팀이 진행한 이 점핑 로봇(DiffuseBot) 설계 프로젝트는 사람이 설계한 경우에 비해 약 41% 향상된 점프 성능을 달성하면서, AI 설계 방식이 실제 로봇의 성능 개선에 얼마나 효과적인지 입증했다.

김병철 박사에게서 직접 디퓨전 모델을 적용한 AI 기반 설계가 갖는 의미와 로봇 설계의 미래에 대해 들어봤다.

김병철 | MIT CSAIL(Computer Science and Artificial Intelligence Lab) 연구원, 박사

AI 기반의 로봇 설계를 연구하게 된 계기는 무엇인가?

석사 및 박사 과정 동안 로봇을 설계하고 제작하면서, 로봇 개발에 소요되는 시간과 노력을 줄일 수 있는 새로운 설계 방법의 필요성을 절감했다. 특히 컴퓨터 성능과 AI 기술의 비약적인 발전을 보며, 로봇 설계에서 AI의 역할이 크게 확장될 것으로 확신했다.

이에 계산 기반 로봇 설계(Computational Robot Design)에 대한 연구를 시작했다. 이는 로봇의 구조와 구동 방식을 사람의 직관이 아닌 컴퓨터 알고리즘을 통해 자동으로 설계하는 것을 목표로 하는 것이다. 인간이 창의적 사고를 통해 설계한다면, 계산 기반 설계는 주어진 조건 하에서 다양한 설계 후보를 생성하고, 그중 최적의 설계를 알고리즘이 탐색하도록 하는 방식이다.

최근에는 이러한 아이디어를 기반으로 AI를 활용한 로봇 설계 연구를 활발히 수행하고 있다. 특히 최근에는 이미지 생성에 주로 사용하는 디퓨전 모델에 기반한 생성형 AI를 활용해 로봇을 자동 설계하는 기술을 개발했으며, 최근에는 점핑 로봇의 성능을 최적화하는 로봇 구조 설계 연구 등으로 발전시켜 나가고 있다.

이번에 공개된 기술은 생성형 AI를 이용해 로봇을 빠르게 설계하고 최적화할 수 있는 것으로 알고 있다. 이번 프로젝트에서 가장 먼저 점핑 로봇의 설계를 시도한 이유는 무엇인가?

기존의 로봇 설계 최적화 기법은 대부분 정적인 변수(예: 링크 길이, 관절 위치 등)에 집중되어 있고, 동적인 상황에서는 효과가 제한적이었다. 생성형 AI가 이러한 한계를 넘을 수 있을지에 대한 가능성을 실험해 보고 싶었다.

동역학적 고려가 필요한 로봇 설계에 도전해 보고자 하는 의도에서 도약 로봇을 연구 대상으로 삼게 되었다. 도약 로봇은 빠른 움직임을 필요로 하며, 이로 인해 구조와 동작이 강하게 상호작용하므로, 동역학에 기반한 정교한 설계가 필요하다. 생성형 AI가 이러한 복잡한 상호작용을 고려한 설계에 얼마나 유용할 수 있을지 검증해보고자 한 것이다.

로봇의 형상은 수많은 3D 좌표값으로 정의되기 때문에, 이를 직접 변수로 설정하여 최적화하기는 매우 어렵다. 예를 들어 로봇의 특정 링크의 길이나 각도는 몇 개의 변수로 표현할 수 있지만, 형상 전체는 수백 개 이상의 변수로 구성되므로, 성능과의 상관관계를 정의한다는 것이 거의 불가능에 가깝다.

이번에 개발한 생성형 AI를 이용한 방법론은 이러한 형상을 직접 모델링하는 것이 아니라, 다양한 형상을 생성하고 그 중에서 우수한 성능을 가진 로봇을 선택하는 접근 방식을 취했다.

이번 연구에서 인간과 로봇은 어떤 식으로 설계 작업에서 역할을 나눴나?

이번에 개발한 생성형 AI 기반 설계 프로그램은, 고차원 공간(많은 변수로 이뤄진 복잡한 형상)에서 최적의 로봇 형상을 찾는 방식이다. 이를 비유하자면, 복잡한 산악 지형 속에서 가장 고도가 낮은 지점을 찾는 작업과 유사하다. 단, 이 지형은 3차원이 아닌 훨씬 더 고차원이라는 점이 다르다. 예를 들어 로봇 형상을 표현하는 데 10개의 숫자가 필요하다면, 성능까지 포함한 탐색 공간은 11차원이 된다. 이 공간에서 각 로봇 설계는 하나의 점으로 표현되며, AI는 성능이 높은 설계를 찾기 위해 탐색을 수행한다.

하지만 이 고차원 공간은 그 차원이 너무 크기 때문에, AI가 전체 공간을 완벽히 탐색하기는 어렵다. 반면, 인간은 이 공간을 정확히 시각화할 수는 없지만, 경험과 직관을 통해 “좋아 보이는” 설계를 어느 정도 판단할 수 있다. 따라서 인간과 AI가 협력하여 역할을 나누는 것이 효과적이다.

특히, 생성형 AI는 자유도가 높은 형상 설계에 강점을 보이지만, 베어링이나 볼트처럼 0.1mm 단위의 정밀도를 요하는 기계 부품의 설계에는 한계가 있다. 이러한 정밀성과 조립을 요하는 부분은 인간이 직접 설계하고, 그 외의 자유도가 높은 부분은 AI가 다양한 형상을 생성하며 탐색하는 방식으로 역할을 분담했다. 예를 들어 로봇의 관절 부위나 조립면은 사람이 설계하고, 뼈대 형상은 AI가 탐색하는 것이다.

이번 연구에서 인간과 AI의 협력 방식에서 가장 중요한 기준은 역할 분담의 명확성이었다. 정밀도와 신뢰성이 필요한 부분은 사람이 설계하고, 창의적이고 다양한 대안을 요구하는 부분은 AI가 탐색하게 함으로써, 두 주체의 강점을 최대한 활용할 수 있었다.

초기 인간이 설계한 점핑 로봇

이번 연구가 갖는 가장 큰 의의는 무엇이라고 생각하는가?

생성형 AI를 활용할 경우 자연의 진화와 유사한 방식으로 로봇 형상을 최적화할 수 있는 가능성을 보여주었다는 점이다.

이번에 개발한 방법은 생성형 AI를 통해 매 반복마다 500개의 로봇 형상을 생성하고, 이들의 성능을 시뮬레이션을 통해 평가한다. 이후 상위 12개의 형상을 선택하여, 그들과 유사한 형상을 중심으로 다음 세대의 형상을 생성하도록 유도하며, 이 과정을 총 5세대 반복한다. 이처럼 우수한 형상에 기반해 성능을 점진적으로 향상시키는 방식은 생물의 진화 과정과 유사하다.

자연에서는 수십만 년이 걸릴 수 있는 진화 과정을, 시뮬레이션 환경에서는 AI를 통해 단기간에 가속화할 수 있다는 점이 이번 연구의 주목할 만한 점이다.

비록 이번 연구는 점핑 로봇이라는 단일 사례에 국한되었지만, 이러한 접근이 다양한 로봇 설계로 확장될 수 있다면, 향후 로봇의 형상 설계 방식에 새로운 가능성을 제시할 수 있을 것이다. 단순히 ‘설계’되는 로봇이 아니라, AI에 의해 점진적으로 ‘진화’하는 로봇 설계로 나아갈 수 있는 기반을 마련했다는 것에서 의미를 찾을 수 있다.

생성형 AI에 의해 최적화된 형상을 갖춘 로봇

이번 연구에서 AI와 인간이 설계하는 방식이 차이를 보인 부분은 어떤 것인가?

도약 로봇의 중요한 원리 중 하나는, 도약 직전 구동기(예: 모터)가 로봇에 가하는 일(work)의 크기가 클수록 높은 도약 성능을 낼 가능성이 크다는 점이다. 즉, 구동기가 로봇에 더 많은 에너지를 전달할수록, 로봇의 운동 에너지가 커지고 이는 더 높은 도약으로 이어질 수 있다.

가장 인상 깊었던 점은, 생성형 AI가 만들어낸 설계 중 일부가 실제 시뮬레이션에서 이 ‘일의 크기’를 자연스럽게 크게 만들어냈다는 것이다. 이론적으로 중요한 원리를 명시적으로 가르쳐주지 않았음에도 불구하고, AI는 수많은 형상 중에서 해당 원리에 부합하는 형상을 찾아낸 것이다.

이러한 경험을 통해, 인간의 설계 방식은 원리를 명확히 이해하고 이를 설계에 반영하는 이론 중심적 접근이라면, AI의 설계는 명시적인 원리의 이해 없이도 경험적 탐색을 통해 결과적으로 원리에 부합하는 설계에 도달한다는 점에서 큰 차이가 있다. 이는 마치 자연계에서 생명체가 진화를 통해 점진적으로 최적의 형태에 도달하는 과정과 유사하다.

자연어 기반의 로봇 설계 인터페이스 구현도 시도하고 있는 것으로 알고 있다. 현재 어떤 단계까지 연구가 진행되었는가?

로봇의 설계나 구조를 표현하는 대표적인 방법 중 하나는 URDF(Unified Robot Description Format) 파일을 사용하는 것이다. URDF는 로봇의 관절과 링크(뼈대) 간의 기구학적 관계를 기술하는 파일로, 하나의 URDF 파일은 특정 로봇 구조를 명확하게 정의하는 형식이라 할 수 있다.

현재 개발 중인 플랫폼은, 사용자의 요구 조건을 입력으로 받아 해당 조건을 만족하는 URDF 파일을 자동으로 생성하는 기능을 갖추고 있다. 즉, “이런 일을 하는 로봇을 만들어줘”라는 자연어 입력을 통해, 그에 부합하는 로봇의 기구학적 구조를 생성하는 것이 가능하다.

지금까지의 연구가 디퓨전 모델을 활용해 로봇의 뼈대 형상(geometry)을 생성하는 데 중점을 두었다면, 이번 연구는 URDF 생성을 통해 로봇의 기구학적 구조(kinematic structure)를 설계하는 데 초점을 맞추고 있는 것이다. 이처럼 두 연구는 서로 다른 측면의 구조 설계에 집중하고 있으며, 장기적으로는 이 둘을 통합해 자연어 기반 로봇 설계 전체를 자동화하는 방향으로 발전시킬 계획이다.

전통적인 인간 중심의 로봇 설계 방식이 생성형 AI에 의해 얼마나 바뀔 수 있다고 생각하는가?

세상은 매우 다양한 환경과 요구 조건으로 이루어져 있으며, 이를 충족시키기 위해서는 단일한 범용 로봇보다는 다양한 목적에 특화된 로봇들이 설계·생산될 필요가 있다. 이런 상황에서는 인간 설계자의 직관이나 경험만으로 수많은 설계 대안을 빠르게 만들어내는 데 한계가 있기 때문에, 생성형 AI와 같은 컴퓨터 기반 설계 기법이 중요한 역할을 할 수 있다.

물론, 생성형 AI가 전통적인 인간 중심의 로봇 설계를 당장 대체할 수는 없을 것이다. 현재의 3D 형상 생성 AI는 기계적 정확도나 조립 가능성 측면에서 여전히 제약이 있기 때문에, AI만으로 완전한 로봇을 설계하기는 어려운 것이 현실이다.

이러한 AI 기반 로봇 설계 기술은 기존 설계자의 생산성과 창의성을 극대화해주는 새로운 설계 도구로서 중요한 역할을 하게 될 것으로 기대하고 있다. 마치 대형 언어모델이 인간을 대체하기보다는 인간의 사고와 표현 능력을 증폭시키는 도구가 되었듯, 생성형 AI 역시 로봇 설계 전문가의 아이디어를 보완하고 더 빠르고 다양한 설계를 가능하게 하는 파트너로 활용할 수 있기 때문이다.

로봇 설계를 AI와 협업하는 방식이 대중화될 경우, 인간 작업자에게 요구되는 역량은 무엇이 될 것이라고 생각하는가?

AI는 가능한 수많은 경우의 수를 찾고, 이 중에서 가장 좋은 결과를 낼 것이라고 예측되는 경우의 수를 찾는 데 탁월하다. 하지만 아무리 컴퓨팅 자원이 발전하고 AI 알고리즘이 정교해진다고 하더라도, 로봇 설계 분야에서는 이 탐색 공간이 지나치게 고차원적이기 때문에, AI 단독으로 설계를 완성하기에는 여전히 한계가 있다.

따라서 인간 작업자에게 요구되는 첫 번째 역량은, AI가 탐색해야 할 설계 공간의 차원을 효과적으로 축소할 수 있는 능력이다. 예를 들어 이번 연구에서는, 인간이 먼저 관절 구조나 기계 부품 결합 방식 등 주요 요소를 정의한 후, 나머지 형상을 AI가 생성하도록 했다. 이런 식으로 인간이 문제를 구조화하고 초기 조건을 설정함으로써, AI가 효율적으로 작동할 수 있는 환경을 조성하는 것이 매우 중요하다.

두 번째로 중요한 역량은, 어떤 문제를 해결할 것인가를 정의하는 능력이다. 이번 연구에서는 도약 로봇의 도약 높이를 성능 지표로 삼았지만, 실제 환경에서는 안정성, 내구성, 비용, 제조 가능성 등 여러 요소들이 동시에 고려되어야 한다. 즉, 로봇이 현실에서 잘 작동하도록 하기 위해서는 어떤 성능 지표를 최우선으로 둘지 결정하는 문제 정의 역량이 인간 설계자에게 더욱 요구될 것이다.

요약하자면, AI와의 협업 시대에는 단순한 설계 작업보다도, 설계 조건을 정하고, 탐색 공간을 구조화하며, 성능 목표를 명확히 정의하는 고차원적 사고 능력이 인간 설계자에게 요구되는 핵심 역량이 될 것이다.

디퓨전 모델 기반 설계 방식은 향후 실제 로봇 설계 분야에서 어떤 식으로 활용될 수 있는가?

이번 연구에 사용한 디퓨전 모델 기반 설계 방식은 로봇의 기구학적 구조보다는 형상(geometry)에 초점을 맞추고 있다. 따라서 로봇의 형상이 성능에 직접적인 영향을 미치는 분야에서 특히 효과적으로 적용될 수 있다.

예를 들어, 드론이나 수중 로봇처럼 공기역학적 혹은 유체역학적 특성이 중요한 로봇들은 형상 변화에 따라 성능이 크게 달라질 수 있기 때문에, 이러한 분야에서 디퓨전 모델 기반 설계 방식의 효과를 보다 명확하게 입증할 수 있을 것이다. 이와 같은 응용에서는 전통적인 설계 방식으로는 찾기 어려운 비정형적이면서도 성능이 우수한 형상을 AI가 제안할 수도 있다.

또한 개인적으로는 이 설계 방식이 반드시 로봇 분야에만 국한될 필요는 없다고 생각한다. 본질적으로 이번 연구의 방법론은 생성형 AI를 통해 다양한 형상을 생성하고, 그에 대한 성능을 평가해가며 점진적으로 설계를 개선해 나가는 구조다. 따라서 로봇뿐 아니라, 자동차의 외관 설계, 가구의 구조 디자인, 산업용 부품의 형상 최적화 등 형상과 성능 간의 관계가 중요한 다양한 산업 분야로 확장될 수 있을 것이다.

핵심은 생성된 형상을 빠르고 정확하게 평가할 수 있는 시뮬레이션이나 분석 기법이 존재하느냐이다. 이러한 평가 시스템이 함께 갖춰진다면, 생성형 AI 기반 설계는 제조, 제품 디자인, 건축, 의료기기 등 다양한 산업 분야에서 유용한 자동 설계 도구로 자리 잡을 수 있을 것이다.

디퓨전 모델 기반 생성형 AI로 설계해 성능이 최적화된 점핑 로봇

이번 연구를 통해 로봇이나 AI에 대해 새롭게 깨달은 점은 무엇인가?

이번 연구를 진행하면서 파운데이션 모델의 가능성과 한계에 대해 깊이 고민하게 되었다.

파운데이션 모델이란, 인터넷 등에서 수집한 방대한 양의 데이터를 기반으로 사전 학습된 범용 인공지능 모델을 의미한다. 이번 연구에서 사용한 오픈AI의 3D 객체 생성 모델인 ‘Shap-E’ 모델은 방대한 3차원 형상 데이터를 바탕으로 학습되어, 다양한 형태의 3D 구조를 생성할 수 있다.

하지만 이번 연구를 진행하며, 기존 파운데이션 모델들이 물리 법칙에 대한 이해 없이 학습되었기 때문에, 생성된 형상이 실제 동작과는 동떨어질 수 있다는 한계를 체감하게 되었다. 예를 들어, ‘Shap-E’ 모델에 “잘 뛰는 토끼 다리”를 만들어달라고 요청하면 그럴듯해 보이는 형상을 생성할 수는 있지만, 실제로는 도약 성능과 무관한 구조일 가능성이 높다.

이러한 한계를 극복하기 위해 이번 연구에는 로봇 시뮬레이터를 통해 생성된 형상의 성능을 반복적으로 평가하고, 그 결과를 바탕으로 더 나은 형상을 탐색하는 구조를 설계했다. 이 방식이 실제로 높은 성능의 로봇을 설계하는 데 효과적이긴 했지만, 동시에 물리적 특성을 내재적으로 이해하는 새로운 형태의 파운데이션 모델의 필요성도 절감하게 되었다.

향후 물리 세계의 제약과 작동 원리까지 학습한 파운데이션 모델이 등장한다면, 시뮬레이션 없이도 실제 동작 가능한 로봇 설계를 AI가 직접 제안할 수 있는 시대가 올 것이다. 이번 연구는 그런 가능성을 엿본 계기였고, 향후 로봇 설계와 AI의 관계가 어떻게 진화할지에 대한 새로운 관점을 갖게 해주었다.

AI 기반의 로봇 설계를 돌아봤을 때, AI의 창의성의 갖는 의미는 무엇이라고 생각하는가?

“AI가 창의적일 수 있는가?”라는 질문은 쉽게 답하기 어려운 주제다. 그럼에도 이번 연구를 통해 나름대로의 창의성에 대한 정의를 정리해볼 수 있었다. 개인적으로 생각하는 창의성은 크게 두 가지 유형으로 나눌 수 있다.

첫째는, 기존에 존재하는 두 가지 이상의 개념을 새로운 방식으로 결합해 새로운 아이디어나 제품을 만들어내는 창의성이다. 예를 들어 스마트폰은 MP3, PMP, 핸드폰 등 기존의 기기를 통합해 등장한 결과물로, 기존 개념의 조합만으로도 충분히 창의적이라 할 수 있다.

둘째는, 기존에 없던 완전히 새로운 개념을 제안하는 창의성이다. 예를 들어 아인슈타인의 상대성 이론에서 “시간은 모두에게 다르게 흐른다”는 발상은 당시까지 존재하지 않았던 개념을 새롭게 제시한 것으로, 후자의 창의성에 해당한다.

이러한 기준에서 본다면, 현재의 AI는 기존 지식과 개념의 조합하여 새로운 아이디어를 도출하는 ‘전자의 창의성’ 에 강점을 보인다. 대규모 데이터를 학습한 AI는 방대한 양의 정보들을 조합해 인간이 미처 떠올리지 못한 새로운 설계나 아이디어를 제안할 수 있기 때문이다.

그렇기에 지금이야말로 인간이 자신의 창의성을 AI와의 협업을 통해 훨씬 더 빠르고 폭발적으로 확장할 수 있는 시대다. 과거에는 MP3, 카메라, 전화기의 기능을 모두 깊이 이해해야 스마트폰이라는 발상을 떠올릴 수 있었다면, 이제는 AI가 관련 정보를 제공하고 조합해줌으로써 인간은 더 빠르게 창의적 발상을 현실화할 수 있게 되었기 때문이다.

요약하자면, AI가 기존 개념을 조합하는 방식의 창의성에서는 이미 강력한 도구로 자리잡고 있으며, 이를 잘 활용한다면 인간의 창의성 역시 새로운 방식으로 확장될 수 있을 것이다. 그리고 이런 창의성만으로도 인류의 과학과 기술의 발전에 큰 기여를 할 수 있을 것이다. 반면, 완전히 새로운 개념을 만들어내는 후자의 창의성에 대해서는 아직까지는 AI가 해결해 나가야 할 숙제로 남아있다.

김병철 박사는 현재 MIT 컴퓨터과학 및 인공지능 연구소(CSAIL)에서 박사후 연구원으로 근무하며, 생성형 AI를 활용한 로봇 설계 자동화 연구에 주력하고 있다. 서울대학교 기계항공공학부에서 학사, 석사, 박사 학위를 모두 취득한 그는, 특히 연성 로봇(Soft Robot) 설계에 관심을 가지고 있으며, 힘줄 기반 구동기(tendon-driven actuator)와 저구동 메커니즘(under-actuation mechanism)을 활용한 착용형 손 로봇 등을 개발했다. MIT에서는 디퓨전 모델 등 생성형 AI 기술을 활용하여 로봇의 3D 형상을 자동 생성하고, 시뮬레이션을 통해 성능을 평가하는 연구를 진행 중이다.