Rebalancing the data economy: Startups for a restart

데이터 경제의 성숙을 추구하는 스타트업

시민, 단체, 정부의 데이터 통제권 회복을 지원하는 스타트업이 증가하고 있다.

빅데이터의 시대는 의료 등 공공의 이익을 위한 귀중한 자원을 만들어 냈다. 지난 1년 반 동안 과학자들은 그 어느 때 보다 빠른 속도로 코로나19에 성공적으로 대응했다. 이는 데이터 수집 및 공유 그리고 가치 생성이 더 큰 사회적 선에 기여한다는 점을 입증한다. 

영국 보건의료 분야 연구자들은 국민보건서비스(National Health Service) 가입자의 의료 데이터에서 코로나19 사망률을 높이는 위험 요소와 장기치료 환자의 특징에 관한 데이터를 생성하는 데 성공했다. 또, 연구자들은 민감한 의료기록에 대한 접근성을 바탕으로 모더나 백신, 화이자 백신을 비롯하여 환자의 생명을 구하는 약제를 빠른 시일 내에 성공적으로 개발했다. 

그렇지만 데이터 공유로 인한 혜택과 개인 및 기관의 정보보호의 균형을 맞추는 과정에는 마땅히 섬세함이 요구된다. 정부와 기업이 수집하는 데이터의 양이 폭증하면서 이에 대한 조사가 증가하고 정보보호에 관한 우려와 함께 규제 강화를 요구하는 목소리도 높아지고 있다.

하버드 케네디스쿨 말콤 와이너 사회정책센터(Malcolm Wiener Center for Social Policy)를 이끄는 데이빗 데밍(David Deming) 교수는 “데이터에서 혁신이 촉발되는 사례가 늘었다. 데이터는 공공 선을 위해 쓰여야 하고 개인정보는 보호되어야 한다. 정책을 만드는 입장에서는 익숙하지 않은 낯선 과제로, 신중한 접근이 필요하다”고 최근 뉴욕타임스 기고문을 통해 주장했다.

데이터 통제권을 강화하려는 시민과 비영리단체, 정부의 노력을 지원하는 스타트업이 늘고 있다. 데이터 컬레버러티브스(Data Collaboratives)에 따르면 현재 230개에서 증가하는 추세이다.

이들은 개인과 조직의 효과적이고 안전한 데이터 수집 및 사용을 위해 데이터 신탁(trust), 데이터 협동조합(cooperative), 데이터 관리자(steward) 등의 법적, 제도적 장치를 활용한다. 그리고 이 과정에서 거대 기술기업이 가진 데이터 경제 지배력에 도전한다.

 “데이터와 사회의 관계가 근본적으로 무너졌다”고 매트 지(Matt Gee) 브라이트하이브(Brighthive) CEO는 말한다. 브라이트하이브는 데이터 신탁, 공유 데이터(data commons), 데이터 협동조합 등 대안적 거버넌스 모델을 추구하는 네트워크와 단체를 지원한다.

“그것은 [관계가] 경쟁적이기보다 협력적이어야 한다. 개방성과 투명성이 높아지고, 한 곳에 몰리기 보다 널리 분산되고 민주적이어야 한다. 이것이 데이터의 혜택을 보다 공평하게 나누고 편향으로 인한 해악을 줄이는 길이다.”

접근과 통제

코로나19 사태에서 증명 되었듯, 전자건강기록 및 처방·조제 데이터 그리고 역학 기록에 대한 접근은 의학 연구와 공중보건 계획 수립을 강화해준다. 그렇지만 의료 데이터는 정부가 공유 시도를 조사하는 것이 당연하게 받아들여질 정도로 민감성이 높은 자료이다. 따라서 개인 의료정보를 의료전달 외의 목적으로 이용하는 이른바 ‘2차이용(secondary use)’을 위해서는 새로운 거버넌스 체계가 반드시 필요하다.

핀데이터(Findata)는 2019년 5월 핀란드 정부에 의해 핀란드보건복지연구소(Finnish Institute of Health and Welfare)에 설치된 독립 공공기관이다. 핀데이터는 핀란드 국민의 의료 데이터를 연구 목적으로 사용하는 것을 지원하고, 자료 사용 요청을 승인하고, 연구자가 구체적인 통계자료를 요청하면 이를 처리한다. 이 과정에서 핀데이터는 시민의 이익을 보호하고 의학연구와 교육, 보건 계획 수립에 도움이 되는 방향으로 데이터의 가치가 실현되도록 힘쓴다.

핀데이터가 설립되기 전에는 연구를 위해 필수적인 통계 자원에 접근하기 위해 많은 비용을 들이고 복잡한 단계를 거쳐야 했다. “핀데이터의 목표는 의료 데이터 사용을 간소화하고 보장하는 데 있다”고 요한나 세패넨(Johanna Seppänen) 소장은 말한다.

“전에는 데이터 보유 기관과 병원에서 데이터를 받기 위해 각 기관의 데이터 컨트롤러(data controller)에게 개별적으로 신청해야 했다. 표준 데이터 취급 방식도 없고 가격 책정 기준도 없었다. 시간이 오래 걸리고, 힘들고 헷갈리는 부분도 많았다.”

이런 목적으로 설립된 기관으로는 아직까지 핀데이터가 유일하다. 그렇지만 안전한 방식으로 의료 데이터의 가치를 높이고자 하는 나라가 있다면 핀데이터를 주목할 것이다.

최근 영국 국민보건서비스는 공중보건계획 수립을 위해 데이터 공유시스템 개선을 추진하는 과정에서 개인정보보호를 주장하는 시민단체의 반발에 부딪혔다. 이 사례는 데이터 수집 및 공유 제도를 바꾸려 할 때 어떤 어려움에 부딪힐 수 있는지 보여준다.

역량 강화와 자율성

새로운 데이터 거버넌스 체계의 또 다른 핵심 분야는 권리를 뺏긴 개인과 조직에 대한 지원이다.

데이터 관리자(공동체 기반 단체에서 공공 및 민간기구까지 다양하게 분포)는 “데이터 교환 시 중개자 겸 보호자가 되어 개인과 공동체가 효과적으로 데이터 경제에 대처하고 데이터 권리 협상에 임하도록 지원한다”고 압티(Aapti)의 전략·파트너십 담당 연구원 수하 모하메드(Suha Mohamed)는 말한다. 압티는 데이터 권리를 중심으로 기술과 사회의 관계를 연구한다.

데이터 관리자 제도는 긱 경제(gig economy)에 참여하는 개인에게 특히 유용하다. 긱 경제는 빠르게 성장하는 노동시장의 한 분야로, 정규 일자리 대신 단기 또는 자유계약 일자리가 주를 이루고 권력관계의 불평등이 빈번하게 발생한다.

“비대칭적 데이터 통제력은 긱 플랫폼이 노동력을 통제하고 산업 논리와 공공정책에 영향을 미치기 위해 사용하는 주된 수단”이라고 헤이스 위트(Hays Witt) 드라이버스시트(Driver’s Seat) 공동설립자 겸 CEO는 말한다. 드라이버스시트는 차량호출 서비스 기사들의 출자로 설립된 데이터 협동조합이다.

“극소수를 제외한 대다수의 이해관계자가 생산적이고 건설적인 개입을 위해 필요한 데이터에 접근할 권한이 없다. 긱 노동자도 마찬가지다. 기술과 데이터 협동조합을 활용하여 자신의 데이터를 수집, 요약, 공유할 권리를 긱 노동자에게 주자는 것이 우리의 목표”라고 위트는 강조한다.

드라이버스시트는 노동자가 자신의 위치와 업무, 소득 정보를 보내면 이를 요약 및 분석하는 독점 앱을 개발했다. 기사는 앱을 통해 자신의 실제 소득과 실적을 손쉽게 파악하고, 이를 기반으로 일할 장소와 시간, 플랫폼, 조건을 선택할 수 있다.

드라이버스시트는 지역의 플랫폼에서 기사가 버는 실질 평균 소득을 계산하고, 이를 전체 평균과 비교하고, 소득의 증가 또는 하락 여부도 알려주는 앱도 개발하고 있다. 기사는 이를 통해 유리한 조건을 제시하는 플랫폼을 선택할 수 있고, 이는 파편화된 노동력에게 권리가 주어지는 결과로 이어진다.

위트는 “조합원들의 참여가 활발하다. 매일 하는 일이 실적표에 반영되어 돌아오지만 이를 신뢰하지 않기 때문”이라며 “이들은 실적표가 영향을 미친다는 것 그리고 데이터에 의해 매일의 업무가 조정된다는 것을 안다. 이것이 소득과 삶에 영향을 미친다는 점도 잘 알고 있다” 덧붙인다.

위트는 앞으로 “문제의 집단적 분석을 위한” 대중제공(crowdsource) 정보에서 노동자가 차지하는 비중이 높아질 거라며, 이는 “플랫폼과의 협상에서 집단적인 정책 대안이나 합의를 제시할 능력이 생긴다는 것”을 의미한다고 부연한다.

사회적 사명과 사업 모델의 균형 맞추기

핀데이터 같은 공공기관이든 아니면 드라이버스시트 같은 사업체이든 데이터 분야 스타트업에는 사회적 사명과 사업 지속가능성 사이에서 균형을 잡아야 하는 과제가 주어진다.

지속가능한 재정기반 마련은 비영리단체와 사회적기업이 풀어야 할 주요 과제 중 하나다. 데이터 공정성(data equity)을 목적으로 설립된 기관은 주로 지역사회 및 회원제 기반 수익 그리고 기부금으로 재정을 충당한다. 

그런데 브라이트하이브를 비롯한 몇몇 단체가 민간 기업이 데이터 관리 개선을 위해 기꺼이 지갑을 열 윈윈 모델을 찾았다.

매트 지 브라이트하이브 CEO는 “유럽의 AI 규제 관련 상황을 보고 미국에서 선제적 대응을 준비하는 기업들이 있다”며 “이들은 알고리즘 투명성, 공정성 감사, 고객데이터 사용에 관한 대안적 거버넌스 모델 등의 문제에 대해 적극적인 입장을 취한다.”

데이터 공정성을 추구하는 플랫폼들은 제 3자가 사회에 긍정적인 방식으로 수익자 데이터(beneficiary data)를 활용하는 수익모델을 찾았다. 헤이스 위트 드라이버스시트 CEO는 지방자치정부와 계획 당국을 예로 든다.

차량호출 서비스의 경우 기사가 손님을 태우지 않고 돌아다니면서 매연을 내뿜고 도로혼잡을 유발하는 ‘데드타임(dead time)’을 줄이면 정부와 기사 둘 다에게 이익이 된다. 적절한 데이터를 필요한 방식으로 수집, 요약, 분석하면 교통 및 이동 관련 결정과 기반시설 개입을 개선하는 것도 가능하다. 그 결과 모든 참여자에게 이익이 돌아간다.

위트는 수익자 데이터가 전혀 관련이 없는 민간부문 주체에게 중요하게 사용되고, 기사의 이해관계는 침해하지 않는 ‘중립’ 사례로 상업부동산 개발을 예로 들었다. 상업부동산 개발업체는 어쩔 수 없이 오래된 교통 및 모빌리티(mobility) 데이터에 근거하여 투자 및 서비스 결정을 할 때가 많다.

드라이버스시트는 상업부동산 개발업체에 데이터 분석 결과 요약을 제공하고, 그 수익으로 긱 노동자에게 배당금을 지급하고 조합 재정도 확충하는 방안을 추진하고 있다.

지속적인 수익창출을 고민하는 많은 데이터 스타트업들은 수익 활동을 어디까지 허용할지 명확한 한계를 정해야 한다.

매트 지 브라이트하이브 CEO에 따르면 기업이 ‘쿠키(cookies)’ 퇴출에 대응할 수 있도록 지원하는 스타트업에 대해 투자자들이 높은 관심을 보이고 있다. 쿠키는 제3자 광고의 필수 요소였지만 이제 점점 사라지는 추세다. “투자자는 제3자 데이터의 종식을 우려하면서, 이 문제를 해결해 줄 기업을 절실하게 원한다.”

그렇지만 사회 문제에 신경 쓰는 스타트업은 기업 고객의 주문이 늘면 공공 선을 추구하는 사명과 수익사업 사이에서 균형을 잡아야 한다.

“공익을 추구하는 기업에 중요한 것이 무엇을 어떻게 하느냐일까 아니면 누구와 하느냐일까? 우리가 데이터 투명성과 책임성을 담당하는 사업이 고객명단을 모아서 사용하는 마케팅 조직의 사업이라면 우리가 하는 일이 정말 사회적 해악을 줄이는 일일까? 우리는 늘 이런 질문을 고민한다”고 지는 전한다.

데이터 스타트업은 다양한 문제에 부딪힐 수밖에 없다. 사회적 과제와 윤리 그리고 사업모델 사이에서 균형을 잡는 일이 특히 중요하다. 데이터 경제가 지속적으로 성장함에 따라, 이들은 데이터에서 얻은 통찰을 시민, 조직, 정부를 위해 책임성 있게 활용하는 새로운 방식을 고안할 수 있는 위치가 되었다. 이는 데이터를 둘러싼 힘의 일부를 거대 기술기업의 손에서 뺏는 것이다.

“우리의 데이터 경제는 모든 사회 구성원을 위해 가치를 창출한다는 사명을 잊어서는 안 된다. 이를 위해 사용자 통제권, 중재 신뢰, 집단 거버넌스 등의 요소를 새로운 데이터 거버넌스 모델에 대입해야 한다”고 사회적 벤처기업 오미디어 네트워크(Omidyar Network)에서 기술책임성을 담당하는 수샨 쿠마르(Sushant Kumar)는 말한다.

“일정 수준 이상의 사용자 참여, 규제 당국의 지원, 재정 지속가능성 달성 등의 요소도 현 상황을 변화시키고 기존 패러다임의 공정성을 강화할 수 있게 해줄 것이다.”

본 기사는 MIT 테크놀로지 리뷰의 편집팀이 아닌, 맞춤 콘텐츠팀 인사이트가 작성했음.

미리보기 3회1회

MIT Technology Review 구독을 시작하시면 모든 기사를 제한 없이 이용할 수 있습니다.