A major AI training data set contains millions of examples of personal data
AI 훈련 데이터서 신분증·이력서 등 개인정보 무더기 발견
생성형 AI 모델 훈련에 사용되는 세계 최대 규모의 오픈소스 데이터세트 중 하나에서 개인 식별이 가능한 기밀 정보가 다수 발견되어 AI 모델 개발 과정에서 개인정보 침해 가능성에 대한 경각심이 커지고 있다.