fbpx
Quantum physicists have shrunk and “de-censored” DeepSeek R1

스페인 연구진, ‘딥시크 R1’ 경량화 및 검열 기능 제거 성공

스페인 양자 물리학자들이 중국 스타트업 딥시크의 저비용·고성능 추론 모델 ‘딥시크 R1’을 분석한 뒤, 모델 크기를 절반 이상 줄이는 데 성공했다고 밝혔다. 더 나아가 중국 AI 시스템에서는 금기시되던 정치적으로 민감한 사안까지 답변할 수 있도록 기존의 검열 기능을 제거했다고 주장했다.

스페인 양자물리학자들이 중국 스타트업 딥시크가 올해 1월 공개한 저비용·고성능 추론 모델 딥시크 R1을 경량화하고, 모델에 내장된 검열 기능을 제거하는 데 성공했다고 주장했다.

양자 기반 AI 기술을 전문으로 하는 스페인 기업 멀티버스 컴퓨팅(Multiverse Computing)은 딥시크 R1보다 규모를 55% 줄이면서도 유사한 성능을 내는 ‘딥시크 R1 슬림(DeepSeek R1 Slim)’을 개발했으며, 이 과정에서 기존 모델에 적용돼 있던 중국 당국의 검열 기능을 제거했다고 밝혔다.

중국에서 AI 기업들은 ‘사회주의 가치’에 부합하는 콘텐츠를 생성하도록 규정하는 법규를 따라야 한다. 이 때문에 기업들은 AI 시스템을 훈련시킬 때 여러 단계의 검열 기능을 포함시킨다. 딥시크에 ‘정치적으로 민감한’ 질문을 하면 모델이 답변을 피하거나 국가 홍보 문구를 그대로 반복하는 것도 이 때문이다.

멀티버스는 모델 규모를 줄이기 위해 양자물리학에서 차용한 복잡한 수학적 기법을 활용했다. 이 접근법은 고차원 격자로 구성된 네트워크를 사용해 방대한 데이터 세트를 표현하고 처리한다. 이러한 텐서 네트워크(tensor network)를 활용하면 모델 규모를 크게 줄이면서 복잡한 AI 시스템을 더욱 효율적으로 표현할 수 있다.

이 방식의 장점은 모델 안의 모든 상관관계를 하나의 ‘지도’처럼 파악할 수 있어 특정 정보를 정확하게 식별해 제거할 수 있다는 점이다. 멀티버스 연구진은 모델을 압축하고 필요한 부분을 편집한 뒤, 원본 모델의 출력과 최대한 유사하도록 미세 조정 작업을 진행한다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!