구글과 경쟁중인 AI 언어 기반 번역 딥엘(DeepL), 창업자를 만나다

구글 번역보다 최소 3배 이상 나은 결과로 세계에서 가장 정확한 번역 기계라고 평가받는 딥엘(DeepL)의 CEO 야로스와프 쿠틸로브스키가 오는 8월 한국의 전문가(pro) 서비스 론칭을 앞두고 MIT 테크놀로지 리뷰 한국판 박세정(John Park) 발행인과 만났다.

딥엘의 CEO 야로스와프 쿠틸로브스키(Jaroslaw Kutylowski)는 폴란드와 독일에서 자란 덕분에 언어 장벽의 무게를 일찌기 경험했다. 그는 “내가 살았던 지역은 30분 거리에 네덜란드, 45분 거리에 벨기에 등 다른 언어를 사용하는 나라들이 인접해 있었다. 그런 환경 덕분에 3개 언어를 배웠지만, 언어가 다른 이유로 얼마나 많은 문제가 생기는지 잘 알고 있다”라고 말했다. 독일 파더보른 대학교에서 컴퓨터 공학 박사 학위를 받고 과학기술자로 언어 관련 회사에서 일한 이력을 가진 쿠틸로브스키는 팀과 함께  ‘언어 장벽 없는 세상’을 비전으로 회사를 설립하고, 2017년 8월 딥러닝과 신경망 기반 번역기 딥엘을 출시했다. 

안녕하세요. 딥러닝 기술로 만든 번역이라고 알고 있습니다. 딥엘 소개 부탁드립니다. 

야로스와프 쿠틸로브스키(이하, JK) 회사는 2017년 설립했습니다. 말씀하신 것처럼 설립 초부터 딥러닝 AI를 도입했고 신경망을 번역에 활용한 것은 업계 최초였습니다. 이것이 회사의 핵심입니다. 딥엘은 풀스택 회사에요. 연구, 엔지니어링, 제품까지 자체적으로 해내죠. 우리의 사명은 사람들이 더 나은 커뮤니케이션을 할 수 있도록 만드는 것, 사람들의 커뮤니케이션을 돕는 것입니다. 

몇 년 전만 해도 번역 도구가 많지 않았습니다. 구글 번역이나 네이버 파파고 정도였죠. 딥엘의 경쟁자는 누구입니까?

JK 저희는 항상 구글 번역과 경쟁해 왔어요. 파파고도 5년이 넘은 것으로 알고 있습니다. 2020년 전문가들을 대상으로 실시한 블라인드 번역 평가(정기적으로 실시함)에서 딥엘 번역을 선호할 가능성이 4배 더 높은 것으로 나타났죠. 그밖에 수행 평가에서도 구글보다 3배 이상 최대 6배 정확한 것으로 조사되었습니다. 사실 개발할 당시에는 비즈니스가 이렇게 성장할 줄 몰랐습니다. 첫 번째 제품을 출시한 첫 주에 알았어요. 사용자를 포함해 언론의 관심이 뜨거워서 큰일이 될 거라고 예감했죠. 저희는 번역이 개인의 문제일 뿐만 아니라 기업에도 문제이며 새로운 시장으로 확장해야 한다고 생각해서 그 방향으로 나아갔습니다. 무엇보다 품질이 제품의 원동력이기 때문에 그 부분에 중점을 뒀고요. 현재는  31개국 언어를 서비스하고 있습니다. 딥엘은 사용하기도 쉽지만, 글의 품질을 중요하게 생각하는 사람들에게 번역을 조정할 수 있는 옵션을 제공합니다. 비즈니스의 경우 번역은 정말 중요하죠. 

기계 번역의 품질이 높아지면 번역 시장도 활성화될 것 같습니다. 잠재적 시장은 얼마나 되나요?

JK 전체 번역 시장을 보면 약 600억 달러 정도 됩니다. 하지만 이 수치의 큰 부분은 전통적인 언어 서비스 제공업체, 번역가, 해당 분야의 에이전시가 차지하고 있습니다. 최근 보고서에 의하면 기계 번역은 100억 달러 정도로 추정되고요. 콘텐츠의 양이 점점 많아지고 있고 번역 요구 사항도 실제로 많이 증가했습니다. 향후 몇 년간 5~10% 성장할 것으로 전문가들은 예상하고 있습니다.

경쟁사 대비 정확도 조사

조사결과 경쟁사(구글) 보다 3배 이상 정확한 것으로 나타남.
출처: 딥엘 사이트(www.deepl.com/en/whydeepl)

번역의 차별화를 이끈 딥엘의 번역 기술과 전략

딥엘은 딥러닝을 통해 매끄러운 번역 결과를 제공한다. 인간의 뇌에서 일어나는 과정을 기반으로 하는 이른바 CNN(convnets neural network, 합성곱 신경망)과 피벗 언어를 사용한 자체 알고리즘 덕분이다. CNN은 한 번에 한 단어씩 처리해 문장을 조합한다. 예를 들어 문장의 마지막 단어가 시작 단어의 구성을 결정하는 경우, 첫 번째 단어가 잘못되었다는 것을 알기 위해 문장 전체를 검토한 다음 다시 번역을 시작해야 하는 문제가 생길 수 있다. 딥엘은 이러한 잠재적인 실수를 모니터링하고 CNN이 다음 단어 또는 구문으로 이동하기 전에 해결하는 ‘주의 메커니즘(attention mechanism)’을 적용하고 있다. 경쟁사인 구글, 마이크로소프트, 네이버도 딥러닝을 사용하지만, 기술적으로 다른 접근 방식을 적용한다. 이들이 사용하는 RNN(recurrent neural network, 순환 신경망) 방식은 자연어 같은 순차적 데이터에 주로 사용하고 단어의 종속성과 순서에 따라 번역한다. 딥엘이 사용하는 피벗 언어는 브리지 언어라고도 하는데, 여러 언어 간의 번역을 위한 중간 언어로 사용되는 자연 언어다. 한국어와 같이 누적 번역 데이터가 부족할 경우, 상대적으로 영어처럼 데이터양이 많은 언어를 피벗 언어로 활용해 번역할 수 있다. 피벗 언어를 사용하면 언어 조합의 수가 정해져 있어서 지원되는 언어의 모든 조합을 만드는 조합 폭발을 피할 수 있다. 이밖에 딥엘은 고유의 신경망 아키텍처와 학습데이터, 공개하지 않는 독점 기술을 통해 번역 품질을 높이고 있다.

딥엘 공식 채널에 따르면 전신인 번역 검색 엔진 Linguee의 기존 데이터 세트를 활용했으며, 인터넷에서 웹 크롤러가 수집한 이중 언어 문장으로 구성된 10억 개의 번역을 학습에 활용했다. 번역기의 신경망은 아이슬란드에 있는 슈퍼컴퓨터에서 실행되는데 최대 성능은 초당 5.1 페타플롭으로, 초당 백만 단어를 번역할 수 있는 수준이다. 

딥러닝과 AI에 기반한 기술과 함께 전문 번역 테스트를 하는 것으로 알고 있는데 번역가의 규모는 얼마나 됩니까? 서비스하는 언어 사용자와의 협력은 어떻게 하나요?

JK 언어 전문가가 몇 명 있지만 회사에서 차지하는 비중은 크지 않습니다. 수학, 수학 연구, 컴퓨터 공학이 더 큰 부분을 차지하죠. 보통 AI에서 차이를 만드는 요소니까요. 신경망이기 때문에 대부분은 수학적 작업이고 언어에 크게 의존하지 않습니다. 하지만 우리는 수천 명의 외부 편집자와 번역가와 함께 일하고 있으며 이들은 번역을 제공, 평가, 특정 프로젝트에 참여하고 있습니다. 

한국어 번역은 쉽지 않을 것 같습니다. 다양한 은어와 방언이 있는데 이런 문제는 어떻게 해결하는지 궁금합니다.

JK 딥엘은 복잡한 언어 번역도 자연스럽게 해냅니다. 바로 AI 신경망의 장점이죠. 가끔은 세세한 부분까지 신경 써야 합니다. 신경망은 지난 몇 년간 커다란 성장을 거두었고 우리가 제공한 예제에서 많은 것을 학습할 수 있었습니다. 문장을 파악하고 들여다볼 수 있는 신경망의 훌륭한 아키텍처를 갖추고 다양한 방언이나 은어를 해독할 수 있는 훈련 데이터를 지속적으로 확보하고 있습니다. 모델을 반복할 때 초기 언어를 생성할 때와 같은 방식으로 업데이트합니다. 

챗GPT 이전과 이후, 차이가 있습니까?

JK 확실히 AI에 대한 인식이 많이 높아졌다고 생각합니다. AI를 도입하고 AI 기반 도구를 사용하고자 하는 기업이 늘어났고요. AI가 대체로 도움이 되지만 한편으로 우려하는 부분도 있죠. 이에 신중한 태도를 보이기도 합니다. 그럼에도 향후 기업에서 더 많이 AI 서비스를 채택하고 전반적인 사용과 성장 속도도 빨라질 거로 보입니다. 챗GPT도 텍스트를 번역할 수 있지만 생성 AI 기술의 한 결과물이며, 우리와는 다릅니다. 딥엘은 차별화된 기술로 최고의 번역만을 목적으로 만들어졌습니다.

마지막 질문입니다. 한국 서비스 론칭을 앞두고 있는데요. 한국 시장을 주목한 이유가 있을까요? 앞으로의 계획도 궁금합니다. 

JK 한국 사람들은 저희 서비스에 관심이 많고 모바일 기기와 인터넷 기술도 뛰어납니다. 실제로 한국 시장은 가장 가파른 성장세를 보여주고 있어요. 전문가 서비스 출시를 앞당긴 이유이기도 하죠. 우리는 딥엘의 기능을 제공하기 위해 국내 기업 및 개인 사용자와 협력을 시작하고 있습니다. 그리고 향후 텍스트 번역뿐만 아니라 더 많은 일을 도모할 계획입니다. 음성 번역 같은 것 말이죠. 특히 아시아 국가는 정말 흥미로울 것 같습니다. 저희의 사명은 의사소통을 돕는 일입니다. 텍스트 번역은 일부에 불과하죠. 번역과 언어, 기술은 이미 아주 멀리 와있습니다. 가장 큰 도전은 그것을 사람과 비즈니스 프로세스에 적용하는 것입니다. 이 또한 AI의 중요한 부분이죠. AI는 매우 빠른 속도로 발전하고 있고 그러한 변화를 따라가는 것은 저희에게도 흥미로운 주제이자 도전 과제입니다.

미리보기 2회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.