The problems with Elon Musk’s plan to open-source the Twitter algorithm

일론 머스크의 트위터 알고리즘 오픈소스화 계획의 문제점

트위터를 인수한 일론 머스크가 트위터의 투명성을 높이기 위해 트위터 알고리즘을 모두 공개하겠다는 계획을 밝혔다. 그러나 이 계획은 그의 의도와는 달리 보안과 관련한 위험성만 증가시킬 가능성이 크다.

일론 머스크(Elon Musk) 테슬라 CEO는 트위터가 그의 인수 제안을 수락했다고 발표한 지 몇 시간도 채 지나지 않아서 앞으로 트위터 운영에 관한 자신의 계획을 드러냈다. 그는 보도자료를 통해 이용자들이 피드를 원하는 대로 설정할 수 있도록 트위터의 알고리즘을 오픈소스화하는 것을 포함해 자신이 계획하고 있는 트위터의 대대적인 변화에 관해 개략적으로 설명했다.

머스크는 언젠가 트위터가 정치적 검열의 대상이 될 수 있다고 오랫동안 우려해왔다. 그리고 이러한 우려를 바탕으로 트위터를 인수해 알고리즘을 오픈소스화하겠다는 계획을 세웠다. 그러나 알고리즘을 공개하는 것이 그가 원하는 결과를 가져다줄 것으로 보이지는 않는다. 오히려 전문가들은 그로 인해 예상치 못한 수많은 문제가 발생할 가능성이 있다고 경고했다.

머스크는 권위에 대해 강한 거부감을 가지고 있는 듯하지만 그가 바라는 ‘트위터 알고리즘 투명화’는 사실 전 세계 정치인들의 바람과 일치한다. 최근 몇 년 동안 전 세계의 수많은 정부는 기술 대기업에 맞서기 위해 각종 플랫폼의 알고리즘을 투명하게 공개해야 한다고 주장해왔다.

예를 들어, 영국에서는 소셜미디어를 규제하는 방송통신규제기관 오프컴(Ofcom)의 멜라니 도스(Melanie Dawes) 위원장은 소셜미디어 플랫폼들이 코드를 공개해야 한다고 말해왔다. 4월 23일 승인된 유럽연합(EU)의 ‘디지털 서비스법(Digital Services Act)’도 마찬가지로 플랫폼이 투명성을 강화하도록 강제할 예정이다. 미국에서는 민주당 상원의원들이 2022년 2월에 알고리즘 책무성 법안(Algorithmic Accountability Act)을 발의했다. 이 법의 목표는 소셜미디어의 타임라인과 뉴스피드를 지배하는 알고리즘을 투명하게 공개하고 감독하는 것이다.

트위터의 알고리즘을 사람들에게 공개하고 경쟁자들이 가져다 쓸 수 있게 한다는 것은 이론적으로 누군가 트위터 소스 코드를 그대로 복제해서 이름만 바꾼 버전을 출시할 수 있다는 의미이기도 하다. 물론 인터넷의 많은 부분은 오픈소스 소프트웨어를 바탕으로 실행된다. 그중에서 가장 유명한 오픈소스 소프트웨어이며 웹의 여러 부분에서 사용되는 보안 툴킷(toolkit)은 2014년에 심각한 보안 문제를 겪었던 ‘오픈SSL(OpenSSL)’이다.

사실 이미 코드가 공개되어 있는 오픈소스 소셜미디어들이 존재한다. 예를 들어 트위터의 지배적인 위치에 대한 우려에서 탄생한 마이크로블로깅 플랫폼 마스토돈(Mastodon)은 코드가 소프트웨어 저장소 깃허브(GitHub)에 게시되어 있어서 이용자들이 마음대로 확인할 수 있다.

그러나 소프트웨어의 코드를 확인한다고 해서 알고리즘의 작동 원리를 알 수 있는 것은 아니며, 평범한 사람들은 코드를 본다고 해도 소프트웨어가 만들어지는 데 필요한 비즈니스 구조와 프로세스에 관해 알아낼 수 있는 것이 많지 않다.

이에 대해 킹스칼리지 런던의 중요 인프라 연구 분야 부교수 조너선 그레이(Jonathan Gray)는 “그건 마치 유전물질만 가지고 고대 생물을 이해하려고 하는 것과 비슷하다”며 “유전물질을 통해 알아낼 수 있는 게 거의 없는데도 고대 생물의 생태를 알 수 있다고 말하는 것은 지나친 과장일 것”이라고 말했다.

게다가 트위터를 통제하는 알고리즘은 하나뿐만이 아니다. 영국 드몽포트 대학에서 컴퓨팅과 사회적 책임에 관해 연구하는 캐서린 플릭(Catherine Flick)은 “사람들이 타임라인에서 어떤 트렌드나 콘텐츠, 추천 팔로워를 보게 할지 결정하는 알고리즘들도 있다”고 말했다. 그중에서도 사람들은 주로 이용자의 타임라인에 보여줄 콘텐츠를 결정하는 알고리즘들에 관심을 갖게 될 것이다. 하지만 그런 알고리즘조차도 학습 데이터 없이는 대체로 아무런 쓸모도 없을 것이다.

케임브리지 대학 박사 후 연구원 제니퍼 코브(Jennifer Cobbe)는 “우리는 알고리즘 책임에 관해 이야기할 때 우리가 보고 싶어 하는 것이 알고리즘 자체가 아니라는 점을 인식하고 있다”며 “우리가 정말 원하는 것은 알고리즘이 어떻게 개발됐는지에 관한 정보”라고 말했다. 우리는 인공지능(AI) 알고리즘이 학습에 사용한 데이터에 내재한 편향을 영구화할 수 있다는 점을 우려한다. 게다가 알고리즘은 누가 개발해서 학습에 어떤 데이터를 사용하는지에 따라 결과가 상당히 달라질 수 있다.

코브는 코드를 오픈소스화하는 것에 이익보다 위험성이 더 크다고 생각한다. 컴퓨터 코드는 알고리즘이 어떻게 학습했는지, 어떻게 테스트됐는지, 어떤 요소나 고려사항이 추가됐는지, 또는 그 과정에서 어떤 것들이 우선시되었는지에 관해 어떤 정보도 제공해 주지 않는다. 따라서 코드를 오픈소스화하는 것이 트위터의 투명성 제고에는 전혀 도움이 되지 않을 수도 있다. 오히려 코드 공개가 중대한 보안 관련 위험을 초래할 가능성이 있다.

기업들은 시스템의 약점과 결점을 파악하기 위해 데이터 보호 시스템을 조사하고 테스트하는 영향평가를 발표하곤 한다. 그 과정에서 시스템의 약점이나 결점을 발견하면 수정하고 관련 데이터는 보안 위험을 방지하기 위해 삭제하는 경우가 많다. 그러나 트위터 알고리즘을 오픈소스화하면 트위터 웹사이트의 전체 코드가 모든 사람에게 공개될 것이고 그러면 ‘나쁜 행위자’들이 코드를 샅샅이 살펴보면서 악용할 수 있는 취약점을 찾아낼 수도 있다.

이어크 보이턴(Eerke Boiten) 드몽포트 대학 사이버보안 교수는 “나는 머스크가 트위터의 모든 인프라와 보안 측면까지 오픈소스로 공개하지는 않을 것이라고 생각한다”고 밝혔다.

오픈소스화된 트위터 알고리즘은 또 다른 문제를 낳을 수도 있다. 알고리즘을 모두 공개하면 ‘나쁜 행위자’들이 시스템을 더 잘 악용하는 데 도움을 줄 것이고 그러면 ‘스팸봇을 모두 제거하겠다’는 머스크의 또 다른 목표를 달성하기가 훨씬 더 어려워질 것이다.

보이턴은 “사람들이 복잡한 알고리즘 코드의 작동 원리를 완전히 이해하지는 못하더라도 트위터가 사용자 타임라인에 게시물을 추천하는 방식은 대략적으로 구분할 수 있을 것”이라면서 “또한 지금도 트위터 사용자들이 트위터의 작동 방식에 관해 아무것도 모르는 것은 아니지만 알고리즘을 오픈소스화하는 것은 ‘나쁜 행위자’들에게 새로운 무기를 제공하는 것이나 다름없다”고 분석했다.

트위터 알고리즘 공개로 인해 의도치 않은 다른 골치 아픈 결과가 발생할 수도 있다. 예를 들어 사람들이 잘 모르는 상태에서 알고리즘을 분석하려고 시도할 때 불가피한 다툼이 뒤따를 수도 있고, 이러한 다툼은 더 불쾌하고 무익한 논쟁으로 이어질 수도 있다.

알고리즘을 오픈소스로 공개한다고 해도 편향과 관련한 문제는 해결할 수 없을 것이며, 문제 제기된 편향을 수정하려고 조치를 취하는 행위는 분명 기술적인 관점이 아니라 정치적 관점에서 해석될 것이다. 특히 우리가 이미 정치적으로 심각하게 양극화되어 있는 이런 상황에서는 그럴 가능성이 매우 크다.

일례로 알고리즘이 좌익 콘텐츠보다는 우익 콘텐츠를 더 쉽게 퍼뜨리는 과정을 살펴본 트위터 연구원들의 최근 논문은 이미 강한 비난의 대상이 되었다. 플릭은 “알고리즘 공개도 이런 식으로 엉망진창이 될 것”이라고 우려를 표했다.

미리보기 3회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.