The future of social networks might be audio

소셜 네트워크의 미래는 오디오다

최근 대화의 친밀감을 되살리는 앱들이 인기다. 하지만 해결해야 할 심각한 콘텐츠 관리 문제도 있다.

매일 아침 난디타 모한(Nandita Mohan)이 이메일을 훑어보는 동안, 대학 친구들의 목소리가 그녀의 귀에 이야기를 건넨다. 지난 하루가 어땠는지 얘기하고, 추억을 나눈다. 팬데믹 와중에 졸업한 바람에 겪는 어려움도 이야기한다.

미국 샌프란시스코 베이 지역에 사는 23세의 소프트웨어 프로그래머 모한은 지금 전화 통화를 하는 것이 아니다. 사적인 팟캐스트를 듣는 것도 아니다. 모한은 카푸치노(Cappuccino) 앱을 사용하고 있다. 이 앱은 친구나 가족 등 비공개 그룹 구성원이 녹음한 음성을 오디오 파일로 다운로드 전해 준다.

모한은 “친구 모두의 목소리를 듣는 것만으로도 우정을 소중히 여기게 된다. 친구들의 목소리를 들을 수 있다는 건 획기적인 일”이라고 말한다.

음성 메시지(Audio messaging) 서비스는 새로운 것이 아니다. 왓츠앱의 음성 메모는 인도에서 특히 유행하고 있고, 위챗(WeChat)의 음성 메시지는 중국에서 인기다. 이런 기능은 코로나19 팬데믹 기간 동안 ‘줌 피로(Zoom fatigue)’를 피하면서도 연락을 이어갈 수 있게 해주는 좋은 방법이 되어 주었다. 그러나 이제 새로운 오디오 앱의 바람이 일고 있다. 이들은 음성이 주는 친밀감과 날것 그대로의 느낌을 핵심 경험으로 삼아 사람들이 다시 한번 음성을 매개로 서로 연결되게끔 한다. 우리가 전화기를 사용하는 방식은 이제 전화 통화에서 메시지를 거쳐 다시 오디오로 돌아오는 순환의 마무리 단계에 온 것일 수도 있다.

새로운 도전자들

가장 잘 알려진 음성 기반 소셜 네트워크는 클럽하우스(Clubhouse)다. 지난해 봄 처음 등장해 열풍을 일으킨 초대 전용 앱이다. 베타 서비스 때 이미 인터넷 초창기 대화방에 토크쇼 같은 느낌을 가미한 듯한 모습으로 호평을 받았다. 이 앱을 사용하는 것은 마치 (온라인) 파티에 잠깐 들러 대화에 참여하는 것과 비슷하다.

그러나 클럽하우스의 약속은 미비한 콘텐츠 관리와 여성혐오적 벤처투자자들의 절제할 줄 모르는 수다로 산산조각 났다. 한때는 이 앱의 팬이었던 뉴욕타임스 기자 테일러 로렌츠(Taylor Lorenz)는 클럽하우스 대화방에서 한 벤처투자자의 태도를 꼬집었다는 이유로 괴롭힘을 당했다.

로렌츠는 “다시는 이 앱을 열 생각이 없으며, 이용자 보호를 심각하게 여기지 않는 소셜 네트워크는 어떤 것도 지지할 생각이 없다”고 와이어드(Wired)와의 인터뷰에서 밝혔다. 로렌츠가 겪은 일은 단 한 번으로 끝나지 않았으며, 그 뒤로 더 심각한 인종차별적 모습들이 연이어 나타났다. 다른 소셜 플랫폼들을 망가트리던 비뚤어진 행태들이 클럽하우스의 배타적이고 멋진 겉모습 뒤에도, 여전히 숨어 있는 것으로 보인다.

※ 편집자주. 클럽하우스는 베타 서비스 기간 중 벤처 투자 및 스타트업 커뮤니티의 남성들이 여성혐오적 발언을 했다는 논란으로 타격을 입었다. 그러나 최근 본격적 서비스 확대와 함께 일런 머스크 테슬라 CEO 등 유명 인사가 참여해 대화방을 여는 등 화제를 모으면서 사용자가 급증하고 있다.

게임용 음성채팅 앱 디스코드도 폭발적 인기를 끌었다. 인터넷 전화(VoIP) 소프트웨어를 이용해 음성을 텍스트로 변환해주는 서비스이다. (이 아이디어는 게임을 하면서 타이핑을 하고 싶어하는 게이머들에게서 나왔다). 지난해 6월, 팬데믹 기간 동안 주변 사람들과 연결되고 싶어하던 사람들의 욕구에 대응해 디스코드는 ‘말이 통하는 나만의 공간(Your place to talk)’이라는 새 슬로건을 발표하고 게이머 중심적 서비스 같게 보이지 않으려 공을 들이기 시작했다. 이 마케팅은 효과가 있었다. 팬데믹 발생 직전인 지난해 2월 140만 명이던 이용자 수는 10월에는 670만 명으로 증가했다.

하지만 흔히 ‘서버’라 불리는 디스코드의 커뮤니티에는 아이들의 온라인 밤샘 파티 커뮤니티처럼 작고 순수한 모임도 있는 반면, 샬러츠빌 백인우월주의 집회와 최근 미국 국회의사당 폭동을 논의하기 위한 극우 과격주의자들의 커뮤니티도 포함되어 있었다.

디스코드와 클럽하우스 두 곳 모두에서 배타적 소집단 문화는 (디스코드의 경우에는 괴짜 게이머 문화, 클럽하우스의 경우에는 거만한 벤처투자자 문화는), 좋게 봐줘도 불쾌한, 심하게 말하자면 편협한 집단 사고가 주도하는 문화를 불러왔다. 하지만 부인할 수 없는 호소가 있다. 말을 하고 정말로 듣는다는 것이 멋지지 않은가? 결국 소셜 미디어의 근간은 바로 ‘목소리의 민주화’라는 약속이다.

말하라, 그러면 들릴 것이다

목소리가 주는 친밀김 덕분에 음성 기반 소셜 미디어는 사회적 거리 두기와 고립의 시대에 훨씬 더 주목 받고 있다. 음성과 영상을 통해 이용자들을 연결해주는 ‘텍스트 없는’ 소개팅 앱 체크메이트(Chekmate)의 CEO 지미 텔레(Jimi Tele)는 온라인에서 가짜 프로필로 남들을 속이는 사기가 발 못 붙이는 앱을 출시하고 싶었다고 말한다.

텔레는 “문자메시지로 인한 익명성과 게임화(gamification)에서 벗어나 진정성에 뿌리를 둔 커뮤니티를 만들고 싶었다”며 “그 안에서 사용자들은 비판 받을 걱정 없이 자기 자신을 있는 그대로 드러내도록 격려 받는다”고 말한다. 이 앱 사용자들은 처음에는 평균 5초 정도의 음성 메모를 남기지만, 차츰 녹음 시간이 늘어난다. 체크메이트에는 영상 옵션도 있지만, 텔레는 사용자들이 음성만 사용하는 것을 압도적으로 선호한다고 말한다. 그는 “이용자들이 [영상보다] 음성 메시지를 덜 위협적으로 본다”고 설명한다.

바로 이런 즉각성과 진정성 때문에 질레스 포우팔딘(Gilles Poupardin)은 카푸치노를 만들었다. 그는 왜 음성 메모들을 다운로드 가능한 하나의 파일로 모아주는 서비스가 아직 없었는지 의아해 했다. 포우팔딘은 “모든 사람이 친구들과 그룹 채팅을 한다”며 “만약 친구들 목소리를 들을 수 있다면 어떻겠는가? 그건 정말 강력한 일”이라고 말한다.

모한도 동의한다. 그녀는 친구들 모임이 페이스북 메신저 그룹채팅에서 카푸치노로 옮겨간 뒤, 팬데믹 초기에는 줌 통화도 시도했었다고 말한다. 하지만 대화를 하다 보면 불가피하게 큰 사건의 가장 흥미로운 부분만 말하게 됐다. 모한은 “자세한 얘기를 할 시간이 없었다”고 한탄한다. 매일 나오는 카푸치노의 ‘콩(Beans)’ (카푸치노에서 한데 묶은 음성 메모를 이르는 말이다) 덕에 모한의 친구들은 매우 친밀한 방식으로 서로의 근황을 따라잡을 수 있다. 모한은 “친구 한 명이 낯선 도시의 새 아파트로 이사할 예정이며, 이 친구는 그저 어떻게 부엌에 커피를 마시러 가는지에 대해 이야기했다”며 “이건 너무 사소한 일이라서 줌 통화에서는 결코 알 수 없었을 내용”이라고 말한다.

심지어 기존 소셜 미디어 기업들도 여기에 동참하고 있다. 2020년 여름, 트위터는 음성 트윗을 출시, 이용자들이 자기 목소리를 타임라인에 바로 올릴 수 있게 했다. 12월에는, 사회자가 진행하는 실시간 음성 그룹 채팅 서비스 ‘스페이스(Spaces)’의 베타 테스트를 시작했다.

트위터의 음성 트윗 및 스페이스 팀 선임 소프트웨어 엔지니어 레미 보르고앙(Rémy Bourgoin)은 “오디오 기능이 공개 대화에 참여하는 또 하나의 방법이 될 수 있을 지 궁금했다”고 말한다.

보르고앙은 “스페이스가 잘 준비된 디너 파티에 참석한 것처럼 친근하고 편안했으면 하는 비전”이 있다고 말한다. 그는 “즐거운 시간을 보내기 위해 파티에 있는 사람을 모두 다 알아야 필요는 없지만, 그래도 파티 테이블에 앉아 있는 것이 편해야 한다”고 덧붙인다.

트위터가 ‘편안’하고 ‘친근’한 공간을 만들고 싶어한다는 소리에 코웃음이 나올지 모른다. 어쨌든 트위터는 취약한 사용자들을 위한 안전하고 호의적인 온라인 환경 조성에는 그리 좋은 모습을 보이지 못 했다.

보르고앙은 소규모 인원을 대상으로 한 베타 테스트를 충분한 시간을 두고 실시한 후에야 스페이스를 정식 출시할 생각이다. 다른 오디오 네트워크들이 좀처럼 제공하지 않는 자막 같은 접근성 개선 기능까지 베타 테스트 기간 중에 제공될 정도다. 그는 “현재 스페이스를 쓰고 있는 사람이면 누구나 문제 행동에 대해 신고할 수 있다”며 “우리 팀이 접수된 신고를 검토해 트위터 약관 위반 여부를 평가할 것”이라고 말한다.

불미스러움

관리(moderation)의 문제도 있다. 오디오 콘텐츠 관리는 텍스트보다 훨씬 어렵다. 검색 가능한 텍스트와 자동 관리자 기능도 어느 정도 성공적으로 사용돼 왔지만, 여전히 인간 관리자야말로 커뮤니티 규칙을 준수하지 않는 사람들을 (이들은 인간을 위험에 빠뜨린다) 차단하는 가장 효과적인 방법인 것 같다. 사람들이 언제든지 끼어들어 채팅할 수 있는 플랫폼의 경우, 오디오를 매력적 요소로 만드는 바로 이 민주적 요소가 관리에 있어서는 악몽을 만들어낸다. 작년에 Capiche.fm 베타 버전을 출시한 오스틴 피터스미스(Austin Petersmith)는 “이 점이 모든 사용자 제작 콘텐츠(UGC) 플랫폼들의 큰 과제”라고 말한다. 이 사이트는 일종의 ‘청취자 전화 참여 라디오 프로그램’ 같은 소프트웨어 커뮤니티에서 성장했다. 즉, 진행자들이 서로에게 전화를 걸어 쇼를 시작하고 방송 중 청취자들이 참여하도록 초대를 하는 사이트다.

클럽하우스 이용자들이 그랬듯, 음성 전용 공간은 인터넷의 다른 곳들과 마찬가지로 금세 흉악해질 수 있다. 소외계층, 여성이나 제 3의 성, 유색인종, 젊은 세대 등 온라인에서 이미 괴롭힘을 당하고 있는 사람들은 단속하기 더 어려운 새로운 유형의 폭력을 겪을지도 모르는 플랫폼에 뛰어들고 싶지 않을 것이다.

또한 이렇게 새롭고 규제가 덜한 플랫폼들이 불만을 품은 극우 과격주의자들과 큐어난(QAnon, 악마를 숭배하는 소아성애자 집단이 미국을 지배한다고 믿는 음모론) 신봉자들에게 매력적일 것이라 볼만한 신뢰할 만한 이유도 있다. (이들은 지금 자신들만의 팟캐스트 네크워크도 만들고 있다.)

그럼에도 불구하고 음성 기반 소셜 네트워크는 전통적 소셜 미디어가 주지 못하는 것을 주는 것으로 보인다. 이 포맷의 주요 이점 중 하나는 이용자들이 음성 통화나 영상 통화로 서로 직접 연결할 수 있으면서도, 상황에 맞춰 자기 방식대로 움직일 수 있다는 점이다. 전화 통화나 줌 통화는 어느 정도 준비가 필요하다. 그러나 오디오 기반 소셜 미디어의 콘텐츠는 뉴스 속보나 앱 알림, (스마트 기기로 부정적 뉴스나 소셜미디어 포스트를 한없이 찾아보는) 둠스크롤과는 달리 사용자 뜻대로 만들고 소화할 수 있다. 아침마다 친구들의 음성 메모를 듣는 모한은 카푸치노에 대해 “이 앱은 친구 각자가 말할 때 저절로 더 주의 깊게 듣게 만든다. 심지어 얘기를 듣다가 하고 싶은 말이 생기면 메모해 놓기도 한다”고 말이다.

모한에게는 5명의 친구들이 녹음한 음성 메모를 듣는 일이 소중한 일상이 되었다. 친구들의 소식을 자신만의 템포로 따라잡을 수 있다는 것이 장점이다. 모한은 “매일, 일하다 틈틈이 카푸치노를 녹음할 생각”이라며 “친구들 목소리를 전부 다 듣고 있고, 매일매일 친구들과 서로 뭘 하고 지내는지 잘 알게 되는 느낌을 갖는다”라고 말한다.

미리보기 3회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.