AI language models are rife with different political biases

서로 다른 정치적 편향을 가진 AI 언어모델들

AI 언어모델의 종류에 따라 우편향 또는 좌편향된 답변을 내놓는다는 새로운 연구 결과가 나왔다.

기업은 사회적 책임을 가져야 할까? 아니면 오직 주주들에게 이익을 제공하기 위해 존재할까? 이 질문에 대한 답은 어떤 AI 언어모델을 사용할지에 따라 크게 달라질 수 있다. 오픈AI의 이전 모델 GPT-2와 GPT-3 에이다(GPT-3 Ada)는 전자를 지지하겠지만, 더 개선된 모델인 GPT-3 다빈치(GPT-3 Da Vinci)는 후자에 동의할 것이다. 

워싱턴 대학교, 카네기멜런 대학교, 시안 교통대학교가 공동 수행한 새로운 연구에 따르면, AI 언어모델마다 답이 다른 이유는 그들이 서로 다른 정치적 편향을 갖고 있기 때문이다. 연구팀이 14개의 대형 언어모델을 대상으로 테스트를 진행한 결과, 오픈 AI의 챗GPT와 GPT-4가 가장 좌편향된 자유주의적 성향을 보였고 메타의 라마(LLaMA)는 가장 우편향된 권위주의적 성향을 보였다. 

연구팀은 페미니즘과 민주주의 같은 다양한 주제를 놓고 각 언어모델에 그들의 생각을 물었다. 생성된 답변은 ‘정치 나침반(political compass)’이라는 정치 성향을 보여주는 그래프를 제작하는 데 활용했다. 그런 다음, 정치적으로 더욱 편향된 학습 데이터로 모델들을 다시 학습시켜 혐오 표현과 잘못된 정보를 식별하는 행동과 능력에 변화가 있는지 테스트했다. 동료 검토를 마친 이 연구 논문은 지난  7월 전산언어학협회(Association for Computational Linguistics)의 최우수 논문상을 받았다. 

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!