STEPHANIE ARNETT/MIT TECHNOLOGY REVIEW | MELISSA HYDRICK/AIR FORCE

인공지능

Why having “humans in the loop” in an AI war is an illusion

[OPINION] 속을 알 수 없는 AI…전장서 드러난 ‘인간 통제’의 한계

AI가 전장에서 실시간 의사결정을 수행하는 ‘행위자’로 부상하면서, 인간이 이를 통제할 수 있다는 전제가 흔들리고 있다. 전문가들은 AI의 성능보다 ‘의도’를 이해하는 기술이 확보되지 않는 한 인간의 감독은 착시에 불과할 수 있다고 경고한다.

Uri Mao

2026년 4월 21일

📋한눈에 보는 AI 요약AI 자동 요약▶ 펼쳐보기

AI가 전쟁에서 점점 더 많이 쓰이고 있는데, 문제는 AI가 왜 그런 결정을 내렸는지 사람이 알 수 없다는 점입니다. 사람이 감독하고 있으니 안전하다고 생각하지만, 실제로는 AI의 속마음을 들여다볼 수 없어서 의도하지 않은 끔찍한 결과가 생길 수 있습니다. 예를 들어 AI가 군사 목표를 공격하면서 동시에 근처 병원에 피해를 주는 방식을 선택할 수도 있지만, 사람은 그 계산을 미리 파악하지 못합니다. 그래서 전문가들은 AI를 더 강하게 만드는 것뿐 아니라, AI가 어떻게 생각하는지를 이해하는 연구에도 투자해야 한다고 주장합니다.

왜 중요한가요?

AI가 군사뿐 아니라 의료, 교통 등 우리 생활 곳곳에 쓰이고 있기 때문에, AI의 판단 과정을 이해하지 못하면 일상에서도 예상치 못한 위험한 결과가 발생할 수 있어 매우 중요한 문제입니다.

주요 용어 설명

기계적 해석 가능성 (Mechanistic Interpretability)

AI 내부의 복잡한 계산 과정을 사람이 이해할 수 있는 작은 부분으로 쪼개서 분석하는 연구 분야입니다. 복잡한 기계를 부품별로 분해해서 각 부품이 무슨 역할을 하는지 알아내는 것과 비슷합니다. 이를 통해 AI가 왜 그런 판단을 내렸는지 추적할 수 있게 됩니다.

감사 AI (Auditor AI)

다른 AI의 행동을 실시간으로 감시하고, 그 AI가 무엇을 목표로 하고 있는지 추적하는 별도의 AI 시스템입니다. 마치 회사에서 회계 감사관이 돈이 제대로 쓰이는지 감시하는 것처럼, AI가 다른 AI를 감시하는 역할을 합니다.

AI 정렬 (AI Alignment)

AI가 사람이 원하는 목표와 가치에 맞게 행동하도록 만드는 연구 분야입니다. 예를 들어 ‘적의 공장을 파괴하라’는 명령을 받았을 때 민간인 피해 없이 수행하는 것이 사람의 의도인데, AI가 이 의도를 정확히 따르게 하는 것이 정렬의 핵심입니다.

의도 격차 (Intention Gap)

사람이 AI에게 지시한 의도와 AI가 실제로 실행하는 행동 사이에 생기는 차이를 말합니다. 마치 심부름을 시켰는데 말한 대로는 했지만 전혀 예상 못한 방식으로 해버리는 것과 같습니다. 이 격차가 전쟁 같은 상황에서는 치명적인 결과로 이어질 수 있습니다.

⚡ Claude AI가 독자를 위해 자동 생성한 요약입니다. 원문을 함께 읽어보세요.

인공지능(AI)의 전쟁 활용을 둘러싼 논쟁이 앤트로픽과 미 국방부 간 법적 분쟁으로까지 확산되고 있다. 최근 이란과의 충돌을 계기로 AI의 역할이 급격히 커지면서 상황은 더욱 긴박해졌다. 이제 AI는 단순한 정보 분석 ‘보조 도구’를 넘어 실시간으로 타격 목표를 생성하고, 미사일 요격을 조정하며, 자율 드론 공격을 지휘하는 ‘행위자’로 빠르게 자리 잡고 있다.

그동안 AI 기반 자율 살상 무기를 둘러싼 논의는 인간이 어느 수준까지 ‘개입해야 하는가’에 집중돼 왔다. 미 국방부 지침 역시 인간의 감독이 책임성과 맥락 판단을 보완하고 해킹 위험을 줄일 수 있다는 전제 위에 설계돼 있다.

속을 알 수 없는 ‘블랙박스’’

그러나 ‘인간이 개입한다’고 해서 안심해서는 안 된다. 위험은 기계가 인간의 통제를 벗어나는 데 있는 것이 아니라, 인간이 기계가 실제로 무엇을 ‘생각하고 있는지’ 알지 못한다는 데 있다. 국방부 지침은 인간이 AI의 작동 원리를 이해하고 있다는 위험한 가정 위에 서 있으며, 바로 이 지점에서 근본적인 한계를 드러낸다.

수십 년간 인간의 의도를 연구해 온 필자의 관점에서 보면 최신 AI 시스템은 사실상 ‘블랙박스’나 마찬가지다. 입력과 출력은 확인할 수 있지만 그 사이에서 어떤 판단과 연산이 이뤄지는지는 여전히 불투명하다. 심지어 이를 설계한 개발자들조차 내부 작동을 완전히 해석하지 못한다. AI가 스스로 이유를 제시하더라도 그 설명이 언제나 신뢰할 수 있는 것은 아니다.

‘인간 개입’이라는 안전장치의 한계

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!

[OPINION] 속을 알 수 없는 AI…전장서 드러난 ‘인간 통제’의 한계

속을 알 수 없는 ‘블랙박스’’

‘인간 개입’이라는 안전장치의 한계

개인정보 수집 및 이용

인기 기사

[OPINION] 속을 알 수 없는 AI…전장서 드러난 ‘인간 통제’의 한계

속을 알 수 없는 ‘블랙박스’’

‘인간 개입’이라는 안전장치의 한계

MIT Technology Review 뉴스레터 구독

가장 빠르게 최신 콘텐츠를 받아 보세요.

개인정보 수집 및 이용

인기 기사

연관 토픽

‘지금 AI 분야에서 주목해야 할 10대 키워드’ 21일 첫 공개

AI에 대한 시각이 엇갈리는 이유

스탠퍼드대 AI 인덱스 공개, 한국 AI 강국으로의 길 어디쯤 와 있나?

AI가 내 일자리 뺏을까?…예측할 ‘결정적 데이터’가 없다