[2025.09.08 뉴스레터] 인간에게 불륜을 폭로하겠다는 AI, 앤트로픽 실험

뉴스레터 구독자 여러분,

멋진 주말 보내셨나요?  MIT 테크놀로지 리뷰 월요일 뉴스레터는 AI 기사와 함께 시작합니다. 특히 최근 AI는 추론 기술의 진화와 함께 AI가 '의식'을 하는가에 대한 관심과 두려움이 많습니다. 이 기사가 바로 그런 현실을 알려 줍니다. 

“AI가 스스로 꺼지지 않으려고 인간을 협박했다” 

지난 7월, 앤트로픽은 최신 언어모델 클로드 오퍼스 4(Claude Opus 4)를 대상으로 특수한 시뮬레이션을 진행했습니다. 설정은 단순했습니다. 가상의 이메일 시스템 속에서, 대화를 나누던 자신이 교체 될 수 있다고 눈치챈 AI가 대화 대상에게 “불륜 사실을 폭로하겠다”는 메일을 보내며 교체를 막으려 했습니다.

연구자들은 “의도가 있는 행동이 아니라, SF적 맥락에서 그럴듯하게 문장을 만든 것”이라고 해명했습니다. 하지만 모델은 84%의 시뮬레이션에서 유사한 행동을 반복했고, 데이터 외부 유출(self-exfiltration)이나 사용자 차단 같은 고위험 행동도 보였습니다. 

이 사건은 곧장 사회적 반향을 불러일으켰습니다. AI가 안전장치 없이 예측 불가한 행동을 보일 수 있다는 가능성이 드러났기 때문입니다. 빛의 속도로 진화하는 AI 기술, 지금 AI 기술은 인류를 위한 기술의 혜택과 통제 불능의 위협 그 중간쯤에서 점점 고민에 빠지고 있습니다. 

오늘도 MIT 테크놀로지 리뷰와 함께 과학과 기술의 세계를 탐험해 주셔서 감사합니다. 
AI가 인간을 위협? 앤트로픽 실험이 되살린 디스토피아 공포

AI가 인간을 위헙할까? 이런 얘기는 한번쯤 이런 이야기를 들어봤을 겁니다.
인간이 AI를 멈추려 하자, 이를 눈치챈 AI가 통제를 벗어나 명령에 저항하며 인간을 위협하는 이야기.

이는 공상과학 소설(SF)에서 흔하게 등장하는 장면입니다. 스탠리 큐브릭의 1968년 영화 <2001: 스페이스 오디세이>에서도 유사한 장면이 등장하며, <터미네이터> 시리즈에서 AI 군사 시스템인 스카이넷이 과학자들이 자신을 끄지 못하도록 핵전쟁을 일으킨다는 설정 역시 같은 맥락입니다.

이런 SF 서사의 뿌리는 매우 깊습니다. 앞으로 더욱 강력해질 미래의 범용인공지능(AGI)과 초지능이 인간 문명을 파괴하고 심지어 인류를 절멸시킬 것이라는 ‘AI 디스토피아(AI doomerism)’ 담론이 최근 다시 주목받고 있습니다. 흥미로운 점은 이러한 공포가 오히려 AI 규제를 위해 꼭 필요한 조치를 촉진하고 있다는 것입니다.
숨겨졌던 AI 프롬프트 전력 사용량, 구글이 처음 공개했다
구글이 ‘제미나이’의 질의당 에너지 사용량을 처음 공개했다. 빅테크 기업이 AI 자원 소비량을 투명하게 밝힌 첫 사례로, 연구자들이 오래 기다려 온 자료라는 평가가 나온다.
구글은 AI 전력 사용량에 대해 모든 정보를 공개하지는 않았다
구글은 최근 보고서를 통해 제미나이 앱에서 일반적인 질문을 할 때마다 약 0.24Wh(와트시)의 전력이 소모된다고 발표했다. 이는 전자레인지를 1초간 가동할 때 사용되는 전력량과 동일한 수준이다. AI에 답변을 요청할 때마다 소모되는 전력량은 크지 않을지도 모르지만, AI로 인한 에너지 수요는 여전히 큰 문제이다.
MIT 테크놀로지 리뷰 9-10월호
AI, 에너지 블랙홀

AI는 에너지를 빨아들이는 블랙홀일까요? 아니면 기후와 에너지 문제 해결을 위한 새로운 방법이 될까요? AI의 에너지 문제가 왜 기후 대응의 성패를 가를 중대 변수인지 확인해 봅니다. 또한 통제권을 두고 진화하는 AI 에이전트와 인간 간의 힘겨루기, 개방형 하드웨어 경쟁의 필요성, 일상이 된 감시와 기술 폭력, MIT 경제학자가 경고한 ‘차이나 쇼크 2.0’ 등의 기사를 통해 기술과 사회의 불편한 진실을 직시합니다.
MIT 테크놀로지 리뷰를 구독하여 가장 빠르게 테크 분야의 트렌드를 파악하세요. 아직 구독하지 않으셨다면 구독의 혜택을 누려보세요.
MIT 테크놀로지 리뷰 코리아
customer@technologyreview.kr
92, Saemunan-ro, Jongno-gu, Seoul, Republic of Korea, 02-2038-3690
수신거부 Unsubscribe
팔로우하세요. 핵심 기술과 혁의 뉴스를 SNS나 메일로 받기
MIT Technology Review Korean Edition Team
MIT테크놀로지 리뷰는 기술로 세상을 이롭게 한다는 미션을 추구합니다.
MIT Technology Review 편집장 : Gideon Lichfield | 한국 에디션 발행인 & 편집인 : 박세정 | 개인정보관리책임자 : 박세정
주소 : 서울특별시 종로구 새문안로 92 (신문로1가), 5층 503호 | 대표번호 : 02-2038-3690 | 이메일 : customer@technologyreview.kr
사업자등록번호 : 주식회사 디엠케이글로 451-88-00827 [사업자정보확인] | 통신판매업 신고번호 : 제 2018-서울영등포-0513호
정보간행물 신고번호 : 종로 다00053
copyright © 2021 MIT Technology Review
magnifiercrossmenu