Andrew Ng: Forget about building an AI-first business. Start with a mission.

‘AI-퍼스트’보다 더 중요한 것이 있다

AI의 선구자 앤드류 응이 기업이 머신러닝을 활용해 운영을 혁신하고 중대한 문제를 해결하는 방법을 제시한다.

앤드류 응은 그간 여러 역할을 해 왔다. 구글 브레인 팀의 설립자이며, 바이두의 수석 과학자 출신이기도 하다. 그의 온라인 강의를 통해 수많은 학생, 호기심 많은 사람들, 기업가 등이 머신러닝의 원리를 배웠다.

이제 그는 2017년 창업한 벤처기업 랜딩AI(Landing AI)에서 방대한 데이터세트가 없는 기업도 AI 혁명에 동참할 수 있게 하는 길을 모색하고 있다.

응은 최근 열린 MIT 테크놀로지 리뷰 연례 AI 이벤트 ‘Em테크 디지털(EmTech Digital)’에 참여, 그가 얻은 교훈을 공유했다.

이 인터뷰는 명확성을 위해 요약 및 편집되었다.

MIT 테크놀로지 리뷰: “‘AI-퍼스트 (AI-first)’ 비즈니스를 어떻게 구축해야 하나?”라는 질문을 자주 들을텐데, 보통 뭐라고 하나?

앤드류 응: 보통 “그렇게 하지 말라”라고 말한다. 어떤 팀에 가서 “AI를 우선으로 해달라”라고 말하면, 그 팀은 기술에 집중하게 되는 경향이 있다. 연구소라면 이 편이 좋을지도 모른다. 하지만 실제 비즈니스는 고객이나 해야 할 업무(mission)이 주도하는 것이지 기술이 주도하는 경우는 거의 없다.

랜딩AI라는 새로운 벤처 기업을 창업했는데, 어떤 기업인지 왜 그러한 일을 선택했는지 말해달라.

구글과 바이두에서 AI팀을 이끌면서 AI가 웹 검색, 온라인 광고 등 소비자 대상 인터넷 소프트웨어를 변화시켰음을 알게 됐다. 하지만 AI를 경제의 큰 영역을 차지하는 다른 모든 산업에 적용하고 싶었다. 그래서 많은 다른 산업들을 살펴본 후, 제조업에 집중하기로 했다. 여러 산업이 AI에 대비하고 있다고 생각한다. 하지만, AI에 대한 준비가 더 잘 되어 있는 산업이 보이는 패턴 중 하나는 디지털 트랜스포메이션을 거쳐 데이터를 확보했다는 것이다. 이는 AI 팀이 데이터를 활용하여 가치를 창출할 기회를 만든다.

최근에 흥미로웠던 프로젝트 중 하나가 비전 검사 장비(visual inspection)를 만드는 것이었다. 제조 라인에서 갓 나온 스마트폰 사진을 보고 결함이 있는지 확인할 수 있을까? 아니면 자동차 부품을 보고 훼손된 곳이 있는지 알 수 있을까? 소비자 소프트웨어 인터넷 분야에는 이를테면, 10억 명의 사용자와 엄청난 양의 데이터를 얻을 수 있다. 하지만 제조업 생산 라인에서는 흠집 난 스마트폰이 10억 개 나오는 일은 없다. 100만 개 나올 일도 없다. 문제는 AI를 100개의 이미지로 작동시킬 수 있느냐는 것이다. 그럴 수 있는 경우가 종종 있다. 많지 않은 데이터로 얼마나 많은 일을 할 수 있는지에 대해 많이 놀랐다. 그래서 비록 AI에 관련된 거대한 데이터세트에 관심이 집중되어 있는 상황이기는 해도, 다른 과제들이 있는 이러한 여러 분야를 해결해 가며 성장할 여지가 많다고 생각한다.

AI를 어떻게 구축하나?

CEO와 CIO가 자주 하는 실수는 다음과 같다. 그들은 나에게 이렇게 말한다. “앤드루, 데이터가 그렇게 많지 않다. 데이터가 엉망이다. IT 인프라를 잘 구축하려면 2년을 달라. AI를 구축할 수 있는 훌륭한 데이터를 얻을 것이다.” 그러면 항상 “그건 실수다. 그렇게 하지 말라.”라고 답한다. 첫째, 오늘날 세계 어느 기업도 심지어 거대 기술 기업들마저 데이터가 완전무결하고 완벽하다고 생각하지 않는 것 같다. 훌륭한 데이터 인프라를 구축하는 데 2년, 3년을 소비하는 것은 구축할 IT 인프라의 우선순위를 정하는 데 도움이 되는 AI 팀의 피드백이 부족하다는 뜻이다.

예를 들어, 사용자가 많은 경우 데이터를 더 많이 얻으려면 사용자들에게 설문조사를 먼저 해야 할까? 만약 공장이라면, 진동 기록 주기를 초당 10번에서 100번으로 늘이도록 센서를 업그레이드하는 것을 먼저 해야 할까? 많은 경우 AI 팀이 어떤 추가 데이터를 수집할지 우선순위를 정할 수 있도록 이미 가지고 있는 데이터에 대한 피드백을 받는 것이 AI 프로젝트의 시작점이다.

소비자 소프트웨어 인터넷만큼 방대한 데이터를 얻기 힘든 산업에서는 사고방식을 ‘빅데이터’에서 ‘좋은 데이터’로 전환할 필요가 있다. 백만 장의 이미지를 가지고 있다면 계속 사용해 보라. 그것도 좋다. 그러나 깔끔하게 라벨링 되고 세심하게 선별된 훨씬 더 작은 데이터세트를 사용할 수도 있다.

예를 든다면? 좋은 데이터란 무슨 의미인가?

음성 인식을 예로 들어 보자. 음성 검색과 관련된 작업을 위해, “음 오늘의 날씨”라는 음성이 담긴 오디오 클립을 받았다고 하자. 문제는, 그 오디오 클립을 글로 어떻게 옮겨야 맞는가 하는 것이다. “음 (,) 오늘의 날씨”라고 해야 할까? 아니면 “음 (…) 오늘의 날씨”라고 해야 할까? 또는 “음” 같은 것은 글로 옮길 필요가 없을까? 이 중 어느 것을 사용해도 좋지만, 여러 작업자가 각기 다른 라벨링 규칙을 사용하면 안 된다. 그렇게 하면 데이터에 노이즈가 발생하여 음성 인식 시스템이 손상된다. 사용자가 수백만 명 또는 십억 명 규모이면 노이즈가 심한 데이터를 학습 알고리즘을 사용하여 평균화할 수 있다. 하지만 데이터세트가 더 작은 환경, 예를 들어 100개라면 이러한 유형의 노이즈 데이터는 성능에 큰 영향을 미친다.

제조업 사례를 하나 이야기하겠다. 우리는 철강 품질 검사에 관한 작업을 많이 수행했다. 차의 옆면은 이전에 강철판으로 만들어졌다. 때때로 강철에 작은 주름이나 찌그러짐이나 얼룩이 생긴다. 그래서 카메라와 컴퓨터 비전을 이용해서 결함이 있는지 확인할 수 있다. 그러나 라벨링을 하는 사람에 따라 데이터의 라벨이 달라진다. 영역 전체에 크게 표시를 하는 사람이 있는가 하면, 작은 흠집 주위에 작게 표시하는 사람도 있다. 데이터세트가 충분하지 않을 때, 여러 검사자가 데이터에 라벨을 일관되게 붙이는 것이 가장 중요한 작업이다.

많은 AI 프로젝트의 경우 깃허브(GitHub)에서 다운로드한 오픈소스 모델, 즉 기존 문헌에서 얻을 수 있는 신경망 기술로 충분하다. 모든 문제에 대해 충분하지는 않지만, 주요한 문제에 대해선 충분히 쓸 수 있다. 나는 함께 일하는 사람들에게 이렇게 말한다. “신경망 성능은 충분히 좋다. 더 코드를 건드리지 말자. 이제 데이터 품질을 개선하기 위한 프로세스를 구축하는 일만 남았다.” 이렇게 하면 종종 알고리즘 성능을 더 빨리 개선하는 결과를 낳는다.

더 작은 데이터세트라는 것은 어느 정도인가? 백 개? 열 개?

머신러닝은 너무 다양해서 일반화된 답을 드리기 어렵다. 최대 2억-3억 개에서 최소 10개 사이의 이미지를 가지고도 문제들을 연구한다. 제조 현장을 보면 불량 등급에 해당하는 결함을 보여주는 이미지들이 수십 개에서 백 개 정도 밖에 안 되는 경우도 종종 있지만, 한 공장 안에서도 차이가 매우 크다.

훈련용 데이터세트의 크기가 예를 들어 1만 개 아래로 줄어들면 AI를 다루는 방식도 바뀐다는 것을 알게 되었다. 그 정도의 크기가 엔지니어가 모든 예를 보고 설계하고 결정을 내릴 수 있는 일종의 한계점이기 때문이다.

최근에 빅테크 기업 중 한 곳의 아주 훌륭한 엔지니어와 이야기를 할 기회가 있어서 “라벨에 일관성이 없으면 어떻게 하나?”라는 질문을 했고, 그는 이렇게 답했다. “우리는 수백 명의 해외 인력들로 이루어진 팀이 라벨링 작업을 한다. 그래서 라벨링 지침을 작성하고, 모든 이미지에 세 사람이 라벨링 하도록 한 다음 평균값을 만든다.” 나는 이렇게 말했다. “거대한 데이터세트로는 그렇게 하는 게 맞다.” 그러나 작은 팀과 함께 일하는데 라벨이 일관성이 없을 때는 서로 의견이 다른 두 사람이 줌 회의를 해서 해결책을 찾도록 한다.

이제 일반 AI 산업에 대한 생각을 말해달라. AI 뉴스레터 더 알고리즘(The Algorithm)을 통해 독자들에게 몇 가지 질문을 미리 받았다. 한 독자는 다음과 같은 질문을 했다. AI 개발은 대부분 학술 연구나 오픈AI와 딥마인드 같은 대규모의 리소스 집약적인 대기업 프로그램으로 나뉘는 것 같다. 소규모 스타트업이 기여할 수 있는 부분이 많지 않다. 중소기업들이 AI를 상업적으로 사용할 수 있도록 하려면 어떤 실현 가능한 문제에 초점을 맞춰야 하나?

언론의 많은 관심은 대기업, 때로는 대형 연구기관에 쏠리는 경향이 있다. 하지만 학술회의에 참석해보면 소규모 연구 단체와 연구소에서 한 작업이 많다. 여러 기업과 산업에 있는 사람들과 이야기해보면 그들이 AI를 사용할 수 있는 비즈니스 분야가 많이 있다. 보통 기업가들에게 이렇게 묻는다. “가장 큰 비즈니스 문제는 무엇인가? 가장 걱정하는 게 무엇인가?” 이 질문을 통해 사업 목표를 더 잘 이해할 수 있고, AI 솔루션이 있는지 브레인스토밍할 수 있다. 물론 AI 솔루션이 없을 때도 있다.

흥미롭게 생각하는 몇 가지 차이를 말씀드리겠다. 오늘날 구축된 AI 시스템은 여전히 손이 많이 간다. 몇몇 뛰어난 머신러닝 엔지니어와 데이터 과학자는 컴퓨터로 일을 처리한 후 실제 생산 공정에 전달한다. 생산 과정에는 수작업 단계가 많이 있다. 그래서 AI 시스템을 보다 체계적으로 구축하고 배포하는 프로세스를 만드는 MLops(머신러닝 운영)에 관심이 많다.

또한 마케팅에서 인사에 이르기까지 일반적인 비즈니스 문제를 살펴보면 자동화 및 효율성 향상을 위한 여지가 많다.

또 AI 커뮤니티가 기후 변화, 노숙자, 빈곤퇴치 등 중요한 사회적 문제들을 위해 무엇을 할 수 있는지 살펴보길 바란다. 때때로 매우 가치 있는 비즈니스 문제 외에도, 중요한 사회적 문제 해결을 위해 노력해야 한다.

어떤 비즈니스에 머신러닝을 활용해 가치를 만들 기회가 있는지 확인하는 프로세스는 어떻게 진행되나?

직접 사업에 대해 알아보고, 기업가들이 AI에 대해 배울 수 있도록 도와준다. 그런 다음 보통 프로젝트들과 각각의 아이디어에 대해 브레인스토밍한다. 기술적으로나 비즈니스적으로 둘 다 성실하게 한다. 충분한 자료가 있는지, 정확성은 어떤지, 생산에 투입할 때 롱테일(long tail)이 있는지, 데이터를 다시 채우고 지속적인 학습을 위해 허점을 보완할 방법은 무엇인지 등에 대해 살펴보면서 문제가 기술적으로 실현 가능한지 확인한다. 그리고 비즈니스에서의 성실함은 원하는 ROI를 달성하도록 만든다. 이 프로세스가 끝나면 리소스, 마일스톤을 추정한 다음 실행을 시작하는 등 일반적인 작업을 수행할 수 있다.

또 다른 제안을 드리자면, 빨리 시작하는 것이 더 중요하며 소규모로 시작하는 것도 좋다. 구글에서 내가 비즈니스 분야에 인공지능을 적용한 첫 번째 의미 있는 사례는 웹 검색이나 광고가 아닌 음성 인식이었다. 그러나 구글 스피치 팀이 음성을 더 정확하게 인식할 수 있도록 도움으로써 브레인 팀은 신뢰를 받고 더 큰 파트너쉽을 맺을 수 있는 기반을 다졌다. 컴퓨터 비전을 사용한 두 번째 큰 파트너쉽은 구글 맵이었다. 구글 맵에서 집의 정확한 위치를 확정하기 위해 집 주소의 숫자를 읽었다. 그리고 그 두 프로젝트가 성공한 후에 광고팀과 더 진지한 대화를 나눴다. 너무 작게 시작해서 실패하는 것보다는 너무 크게 시작해서 실패하는 기업을 더 많이 보는 것 같다. 작은 프로젝트를 통해 조직으로 시작하여 AI를 사용하는 것이 어떤지 학습한 다음 더 큰 성공을 거두는 것이 좋다.

독자들이 자사에 AI를 구현하기 위해 내일 당장 시작해야 할 한 가지는 무엇인가?

뛰어드는 것이다. AI는 많은 산업의 역학 관계에 변화를 일으키고 있다. 따라서 당신의 회사가 아직 공격적이고 현명한 투자를 하지 않고 있다면, 지금이 좋은 시기다.

미리보기 3회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.