What does GPT-3 “know” about me?

GPT-3는 나에 대해서 얼마나 잘 알고 있을까?

대형언어모델은 인터넷에 맴도는 수많은 개인정보를 이용해서 학습한다. 그렇다면 대형언어모델이 ‘나’에 대해서는 어떤 것들을 알고 있을까?

인공지능(AI)에 관해 취재하는 기자에게 올해 가장 중요한 기사는 ‘대형언어모델(large language model)의 부상’일 것이다. 대형언어모델은 사람이 쓴 것 같은 텍스트를 생성하는 AI 모델이다. 가끔은 대형언어모델이 생성한 텍스트가 너무나 그럴듯해서 사람들은 언어모델에 지각이 있다고 착각하기도 한다.

이렇게 강력한 대형언어모델의 성능은 인터넷에 사람들이 작성한 수많은 텍스트를 기반으로 한다. 공개적으로 이용 가능한 인터넷에 떠도는 그런 텍스트를 이용해서 대형언어모델이 학습하기 때문이다. 문득 나는 대형언어모델이 나에 대해서는 어떤 정보를 가지고 있는지 궁금해졌다. 혹시 언어모델이 나에 대한 정보를 오용하는 일은 없을까?

이것은 쓸데없는 질문이 아니다. 나는 어떤 것이든 내 사생활에 대한 정보를 인터넷에 공개적으로 게시하는 것을 병적으로 두려워한다. 10년 전 내 사진과 개인정보가 온라인 대화방에 퍼지면서 힘든 일을 겪었기 때문이다. 당시 내가 핀란드 신문에 썼던 어떤 칼럼을 좋아하지 않았던 사람들이 온라인 대화방에 퍼진 내 정보를 바탕으로 나에 관해 샅샅이 분석하고 조롱하는 일이 있었다.

그 일이 있기 전까지는 나도 다른 많은 사람들처럼 개인 블로그 게시물, 밤늦게 놀러 나가서 찍은 부끄러운 사진들, 내 위치에 관한 글, 만나는 사람에 관한 정보, 정치적 선호도에 관한 게시물 등을 아무나 볼 수 있게 인터넷 여기저기에 부주의하게 올려놓았다. 그러나 지금도 나는 비교적 공인에 가까운 사람이다. 인터넷 검색 한 번이면 기자로서 내가 작성한 모든 기사를 찾아볼 수 있다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!