Lessons from the pandemic’s superstar data scientist, Youyang Gu
코로나19 사망자 수 정확히 예측한 데이터 과학자
구유양(Youyang Gu)은 일주일 만에 머신러닝 모델을 개발하여 매일 노트북으로 프로그램을 실행(1시간 정도 소요)하였다. 그 결과, 코로나19 사망자 수가 놀라울 정도로 정확히 예측되었다.
데이터 과학자 구유양은 자신을 현실주의자라고 생각한다. 본인의 트위터 프로필에 “편견이 없는 사람. 현실주의자!”라고 밝혔다.
지난 봄, 모델 별 코로나19 사망자 수 예측은 중구난방이었다. 여름이면 미국 사망자가 200만 명에 달할 것으로 예상하는 모델도 있었고, 6만 명에 이를 것으로 예측하는 모델도 있었다. 구유양은 이러한 모델링이 정말 좋은 것인지 의문이 들었다. 그는 코로나19 예측 모델을 직접 개발하기로 했다. 맨해튼 소재 본인의 아파트에서 그는 “나의 최종 목표는 가장 정확한 모델을 개발하는 것이었다”고 주장했다. 그는 “‘만약이라는 가정’은 필요하지 않다. 시나리오가 어떤지는 별로 중요하지 않다. 그는 앞으로 일어날 일에 대해서 가장 가능성이 높고 현실적인 예측을 하는 것이 목표”라고 했다.
구유양은 일주일 내에 머신러닝 모델을 만들었고 코로나19 사망자 수 예측 웹사이트를 개설했다. 그는 노트북으로 프로그램을 매일 돌렸으며(1시간 정도 소요), 미국 50개 주, 34개 카운티, 71개국의 코로나 사망자 수 추정치를 게시했다.
4월 말 무렵, 그는 사람들의 주목을 받고 있었다. 수백만 명이 매일 그의 웹사이트를 체크했다. 칼 버그스트롬(Carl Bergstrom) 워싱턴대 생물학과 교수는 트위터를 통해 구유양이 개발한 모델이 “내가 본 모델 중 예측이 정확하다”는 평을 남겼다.