
네이버랩스 유럽, AI 기능 통합한 가벼운 ‘로봇 뇌’ 공개…소형 로봇에도 고성능 AI
자율주행 로봇은 주변을 인식하기 위해 여러 개의 AI 모듈을 동시에 돌려야 했고, 그만큼 무겁고 비싼 연산 장치가 필요했다. 그 여러 개를 하나로 합쳐, 로봇의 ‘뇌’를 가볍게 만들려는 시도다.
로봇이 주변을 인식할 때 쓰는 여러 개의 AI 인코더를 하나로 합쳐, 로봇의 ‘뇌’를 가볍고 빠르게 만드는 기술이 나왔다. 네이버랩스 유럽(NAVER LABS Europe)은 산업과 일상 환경에서 자율주행 로봇의 작업을 한층 수월하게 해줄 범용(유니버설) 인코더 ‘디바인(DIVINE)’을 23일 공개했다.
인코더(encoder)는 로봇이 카메라·라이다 등 센서로 모은 데이터를 AI가 처리할 수 있는 형태로 바꾸는 장치인데, 그동안 로봇은 위치 추정·깊이 계산·공간 이해·사람 인식 같은 작업마다 별도의 인코더를 따로 써 왔다. 디바인은 이 여러 인코더를 하나로 통합해 2D 이미지부터 3D 공간, 사람까지 한 번에 인식한다. 비싸고 무거운 연산 장치 없이도 고성능 AI를 작은 로봇에 실을 수 있게 했다는 점에서 의미가 있다.

인코더가 여러 개라 무거웠던 로봇의 ‘뇌’
자율주행 로봇은 주변 환경을 인식하고 여러 작업을 처리하기 위해 그동안 여러 개의 AI 인코더를 함께 사용해 왔다. 인코더는 카메라나 라이다(LiDAR, 빛을 쏘아 반사 시간을 재 주변을 3차원으로 파악하는 센서) 같은 센서가 수집한 데이터를 AI 모델이 다룰 수 있는 형태로 변환하는 장치다.
문제는 작업마다 인코더가 따로 필요했다는 점이다. 위치 추정, 깊이 계산, 공간 이해, 사람 인식 등 각 작업을 맡는 AI 모델이 저마다 별도의 인코더로 같은 입력 데이터를 여러 번 중복 처리했다. 그 결과 메모리 사용량과 연산량이 과도하게 늘어났다.
이는 곧 하드웨어의 부담으로 이어졌다. 인코더가 많아질수록 더 크고 비싼 연산 장치가 필요해, 기존 로봇용 AI 모델은 주로 서버나 고성능 컴퓨팅 장비에서 구동돼 왔다. 작은 로봇에 고성능 AI를 싣기 어려웠던 이유다. 네이버랩스 유럽은 여러 인코더를 하나로 합치는 방식으로 이 문제를 풀었다.

여러 ‘교사’의 핵심만 뽑아 하나로…’다중 교사 증류’
디바인의 핵심 기술은 ‘다중 교사 증류(multi-teacher distillation)’다. 이미지, 공간, 사람 인식 등 각 분야에 특화된 전문가 ‘교사’ 모델들로부터 핵심적인 지식만 추출해 하나의 ‘학생’ 모델에 이식하는 방식이다. 여러 명의 전문가에게서 요점만 배워 한 사람이 두루 처리할 수 있게 만드는 것에 비유할 수 있다.
이렇게 만들어진 학생 모델이 바로 디바인이다. 2D 이미지 이해, 3D 공간 재구성, 사람 인식 등을 각각 전문으로 처리하던 여러 인코더의 기능을 하나로 응축했다. 여러 개의 대형 전문가 모델을 따로 두지 않고도 다양한 분야를 함께 다룰 수 있게 된 것이다.
덕분에 로봇은 서로 다른 인코더를 여러 개 탑재할 필요 없이 디바인 하나만으로 다양한 AI 작업을 수행한다. 특히 사람과 로봇이 함께 있는 환경에서는 주변 상황을 빠르게 인식하고 즉각 대응하는 것이 중요한데, 디바인은 하나의 인코더로 여러 작업을 처리해 제한된 컴퓨팅 자원으로도 로봇이 주변을 빠르게 파악하도록 돕는다.
메모리 90%↓·속도 향상…작은 로봇에도 고성능 AI
실험 환경에서 디바인을 동작시킨 결과, 연산 부담은 줄고 성능은 높아졌다. 여러 개의 인코더를 탑재했을 때와 비교해 인코더 메모리 사용량은 90%가량 절감됐고, 인코딩 처리 속도는 최대 12배 향상됐다. 로봇 전체로 넓혀 보면 전반적인 메모리 사용량이 약 62% 감소했고, 시스템 처리 속도는 최대 4배까지 빨라졌다.
이 경량화는 로봇이 쓰일 수 있는 범위를 넓힌다. 적은 메모리와 연산량으로 AI 기능을 실행할 수 있어, 로봇 자체에 탑재된 장치에서 직접 연산하는 온보드(on-board) 환경에서의 활용성이 높아진다. 비싸고 무거운 연산 장치를 갖춘 대형 하드웨어 없이도 ‘빠르고 똑똑한 뇌’를 장착해, 스스로 상황을 파악하는 자율주행 로봇을 더 다양한 형태로 운용할 수 있다는 의미다. 게다가 새로운 AI 기능을 쉽게 추가하도록 설계돼, AI 모델이 업그레이드될 때마다 로봇을 새로 도입하지 않고 기존 로봇의 디바인을 업데이트하는 것만으로 성능을 끌어올릴 수 있다.
네이버랩스 비전그룹 이동환 리더는 “전 세계적으로 피지컬 AI의 상용화를 위해 로봇 두뇌 경량화가 주요 화두로 떠오르고 있다”며 “디바인은 일상 및 산업 현장 전반에 걸쳐 AI 로봇 도입 장벽을 낮추는 데 기여할 것”이라고 말했다. 한편 네이버랩스 유럽의 디바인 관련 연구 2건은 각각 2024 유럽컴퓨터비전학회(ECCV)와 2025 컴퓨터비전 및 패턴 인식 컨퍼런스(CVPR)에서 채택됐다.