fbpx

[해외 전문가 특별 칼럼] ① 웹 AI시대의 개막: 사용자의 브라우저도 인터넷도 없이 돌아가는 AI

AI가 웹의 핵심 요소로 자리잡으면서 웹 자체가 빠르게 진화하고 있다. MIT 테크놀로지 리뷰는 앞으로 3회에 걸쳐 구글 연구원 제이슨 메이즈와 타일러 멀린이 기고한 칼럼을 통해 브라우저에서 실행되는 AI의 현재와 미래를 조명한다.

우리가 사용하는 컴퓨팅 파워의 3분의 2는 웹에서 소비된다. 그 웹이 지금 근본적으로 변화하고 있다. 클라우드 서버에 의존하는 대신, 사용자의 브라우저에서 직접 AI 모델을 구동하는 ‘웹 AI’가 빠르게 확산되는 중이다. 서버 비용 부담 없이, 네트워크 지연 없이, 무엇보다 개인 데이터를 외부로 전송하지 않고도 AI를 활용할 수 있다는 점이 핵심이다. 초기 페이지 로드 후에는 완전히 오프라인 상태에서도 AI 추론이 가능하다. 아직 웹 AI를 적극적으로 사용하지 않더라도, 이 기술은 머지않아 우리의 일상적인 AI 도구 세트에서 필수적인 요소가 될 것이다.

이 특별 기고는 AI 강국을 꿈꾸는 한국과 한국 독자들을 위해서 구글 웹 AI의 리더 제이슨 메이즈와 Mediapipe Web 창시자 타일러 멀린이 작성했다.

웹 AI란 무엇인가

웹 AI는 브라우저에서 직접 AI를 실행하는 기술이다. 한 번 웹페이지를 열면, 그 다음부터는 인터넷 연결 없이도 AI가 작동한다. 모든 처리가 사용자의 기기 안에서 이뤄진다.

이는 기존 클라우드 방식 대비 여러 뚜렷한 이점을 제공한다. 먼저 고가의 서버 비용이 발생하지 않는다. 사용자가 늘어날수록 서버 비용이 기하급수적으로 증가하는 클라우드 방식과 달리, 웹 AI는 각 사용자의 기기에서 연산이 이뤄지기 때문에 서비스 제공자 입장에서 확장성 문제에서 자유롭다. 네트워크 지연 시간도 걱정할 필요가 없다. 로컬에서 즉각 처리되기 때문에 응답 속도가 빠르다.

무엇보다 중요한 것은 프라이버시 보장이다. 데이터를 제3자 서버에 전송하지 않기 때문에 사용자의 민감한 정보가 외부로 노출될 위험이 원천적으로 차단된다. 의료 데이터, 금융 정보, 개인 사진처럼 프라이버시가 중요한 영역에서 특히 강력한 장점이다.연구자나 개발자 입장에서도 매력적이다. 새로운 AI 모델의 성능을 실제 환경에서 테스트하고 싶을 때, 링크 하나만 공유하면 즉시 더 많은 사용자와 다양한 기기 유형에서 피드백을 받을 수 있다. 별도의 앱 설치나 복잡한 서버 환경 설정 없이 누구나 브라우저만 있으면 접근할 수 있는 마찰 없는 경험을 제공한다.

내장 AI를 사용하면 웹사이트가 브라우저 API를 로컬 프로세서 (CPU, GPU 또는 NPU)에 연결한다. 그 다음 대답을 전송하는 로컬 모델과 통신하고 API가 응답을 반환한다.

현재 웹 AI는 크게 두 가지 형태로 구현되고 있다.

첫 번째는 웹페이지 코드 자체를 통해 수행되는 모델 추론 방식이다. 개발자가 웹 표준 기술을 활용해 하드웨어 성능을 최대한 끌어올리는 방식으로, 별도의 소프트웨어 설치 없이 브라우저만으로 GPU, CPU, NPU 같은 다양한 프로세서에서 AI 모델을 실행할 수 있다. 웹 표준에 기반하기 때문에 특정 운영체제나 하드웨어에 종속되지 않는다는 것도 큰 장점이다. 브라우저가 지원하는 모든 환경에서 작동한다.

두 번째는 브라우저 자체에 AI 모델을 내장하는 방식이다. 크롬 같은 주요 브라우저들이 최신 AI 모델을 브라우저 차원에서 직접 관리하고 제공하는 방식을 적극 탐구하고 있다. 이렇게 되면 모든 웹사이트가 이미 캐시된 공통 모델을 활용해 텍스트 생성, 요약, 번역 같은 일반적인 AI 작업을 수행할 수 있다. 각 웹사이트가 개별적으로 모델을 로드할 필요 없이 브라우저가 제공하는 표준화된 API를 통해 접근하면 되는 것이다.

두 형태 모두 놀라울 만큼 광범위한 AI 모델을 지원한다. 단순한 선형 회귀나 객체 탐지 같은 전통적인 머신러닝 작업부터, 이미지 생성 확산 모델이나 대형언어모델(LLM) 같은 최첨단 생성형 AI까지 다양하다. 모델을 적절히 압축(양자화)하고 기기에 충분한 성능의 하드웨어가 갖춰져 있다면, 우리가 알고 사용하는 대부분의 AI 모델을 사용자 기기에서 로컬로 실행할 수 있다. 최신 하드웨어가 아니더라도 구형 기기에서 상당한 성능을 유지할 수 있다는 점도 주목할 만하다.

구글의 실험에서 시작된 혁신

브라우저 내 머신러닝의 역사는 2017년 구글의 한 연구 프로젝트로 거슬러 올라간다. 당시 교육과 시각화 목적으로 브라우저 환경에서 신경망을 실행해야 했던 엔지니어 팀이 개발한 이 프로젝트는 처음에는 작은 실험에 불과했다.

하지만 팀은 곧 예상치 못한 가능성을 발견했다. 웹 브라우저에서 AI 모델을 실행함으로써 당시 서버 기반 시스템으로는 달성하기 어려웠던 여러 장점을 얻을 수 있었던 것이다. 프라이버시 보호, 낮은 지연 시간, 비용 절감 등이 대표적이다. 더욱이 제3자 개발자들도 실제 비즈니스 애플리케이션에 이런 형태의 AI를 활용하고 싶어 했다. 연구 프로젝트는 점차 실용적인 도구로 성장하기 시작했다.

2018년 이 프로젝트는 텐서플로우JS(TensorFlow.js)라는 본격적인 자바스크립트용 AI 라이브러리로 진화했다. 파이썬 기반 텐서플로우의 사용하기 쉬운 API에서 영감을 받아 개발자 경험을 크게 개선했다. 무엇보다 다양한 하드웨어 환경을 지원했다는 점이 중요했다. CPU에서 순수 자바스크립트로 실행하는 방식부터, 대규모 모델 처리를 위해 GPU를 활용하는 고성능 옵션까지 선택의 폭이 넓었다. 개발자들은 자신의 프로젝트 요구사항과 타겟 사용자의 하드웨어 환경에 맞춰 적절한 방식을 선택할 수 있었다.같은 해 구글의 컴퓨터 비전 연구진도 웹 AI에 합류했다. 네이티브 앱으로 만들어진 데모를 웹 구현으로 전환해 접근성과 공유성을 높이려는 필요가 생긴 것이다. 이렇게 탄생한 것이 미디어파이프(MediaPipe Web)다. 2019년 처음 공개된 미디어파이프는 컴퓨터 비전 분야에 특화된 웹 AI 솔루션으로 자리 잡았다.

MediaPipe Web 개념 설명

2020년 텐서플로우JS 팀과 미디어파이프 팀이 공식적으로 협력하면서 웹 AI는 한 단계 더 도약했다. 두 팀의 협업은 더 많은 혁신적인 연구를 웹 형태로 전환하는 결과를 낳았다. 얼굴 랜드마크 탐지, 손 추적, 신체 자세 분석, 이미지 분할 같은 다양한 신체 이해 모델이 웹에서 실시간으로 작동할 수 있게 됐다. 웹캠만 있으면 누구나 복잡한 컴퓨터 비전 기능을 브라우저에서 바로 체험할 수 있는 시대가 열린 것이다.

기하급수적 성장의 시대

그 이후 웹 AI의 성장세는 가히 폭발적이다. 2023년 초부터 2024년 말까지 불과 2년 사이에 구글 웹 AI 모델과 라이브러리의 누적 다운로드 건수가 약 10억 건에 달했다. 2018년 당시 연간 100만 건 수준이었던 것을 감안하면 천 배가 넘는 증가다. 이는 단순히 다운로드 수치를 넘어, 웹 AI가 연구실을 벗어나 실제 제품과 서비스에 광범위하게 적용되고 있음을 보여주는 지표다.

2024년 현재 웹 AI 생태계는 훨씬 더 다양하고 성숙해졌다. 구글만의 영역이 아니다. 마이크로소프트는 자체 웹 AI 런타임을 선보였고, AI 모델 허브로 유명한 허깅페이스도 브라우저에서 작동하는 트랜스포머 모델 라이브러리를 출시했다. 오픈소스 커뮤니티도 활발하게 움직이고 있다. 개발자들은 이제 자신의 프로젝트와 기술 스택에 맞는 다양한 웹 AI 솔루션 중에서 선택할 수 있다.

하드웨어의 진화도 웹 AI의 미래를 밝게 한다. NPU(신경망 처리 장치) 같은 AI 전용 칩이 점점 더 많은 기기에 탑재되고 있다. 일반 PC와 스마트폰에도 AI 연산에 특화된 하드웨어가 기본으로 들어가는 시대가 되면서, 웹 AI의 성능과 활용 범위는 계속해서 확대될 전망이다.무엇보다 주목할 점은 사용자 경험의 변화다. 클라우드에 의존하지 않는 AI 경험이 점차 표준이 되어가고 있다. 인터넷 연결이 불안정한 환경에서도, 데이터 요금이 부담스러운 상황에서도, 프라이버시가 중요한 작업에서도 AI를 자유롭게 활용할 수 있는 세상이 열리고 있다. 웹 AI는 단순히 새로운 기술이 아니라, 인터넷과 AI의 관계를 근본적으로 재정의하는 변화의 시작점이다.

제이슨 메이스 (Jason Mayes)는 구글의 Web AI 리드로, 크롬·MediaPipe·TensorFlow.js 등 Web AI 핵심 기술 팀을 대표하며 전 세계 개발자가 브라우저에서 머신러닝을 활용할 수 있도록 지원하고 있다. Google Developers·EdX에 공개된 최초의 웹 AI 공식 강좌의 저자이며, 10만 명 이상이 수강했다. 또한 세계 최초의 ‘Web AI Summit’의 창립자로, 업계 주요 인물들을 한자리에 연결하며 생태계 확장에 기여했다. 기술과 크리에이티브를 모두 아우르는 역량을 바탕으로 구글의 주요 고객사와 내부 팀을 위한 웹 AI 프로토타입을 개발해 왔다.

타일러 멀린(Tyler Mullen)은 MediaPipe Web의 창시자이자 테크니컬 리드로, 구글 Meet의 영상 효과 및 BILIBILI의 실시간 댓글 기능 등을 웹에서 구현하는 데 핵심 역할을 하고 있다. 그는 LiteRT.js를 시작했으며, 크롬 내장형 AI를 위한 GPU 기반 최신 제미나이 나노(Nano) 구현을 주도했다. 이전에는 게임(Roblox, Play Games)과 컴퓨터 비전(Motion Stills) 연구를 했고, 2018년 웹 데모 실험을 계기로 Web AI의 잠재력을 확인한 뒤 해당 분야에 전념했다. 모바일·PC·웹 개발 간 기술적 격차를 줄이고, 연구 단계의 머신러닝을 실서비스로 연결하는 일을 해왔다.