fbpx
A new way to build neural networks could make AI more understandable

AI 작동 원리 이해를 도울 새로운 신경망 구축법, MIT 등 제안

단순화된 새로운 방식으로 신경망을 구축하면 신경망이 어떻게 출력값을 생성하는지 더 쉽게 확인할 수 있다.

신경망에서 ‘인공 뉴런(artificial neuron)’이 작동하는 방식을 조금만 조정하면 인공지능(AI)의 작동 원리를 더 쉽게 해독할 수 있을지도 모른다.

심층 신경망의 기본 구성 요소인 인공 뉴런은 수십 년 동안 거의 변하지 않은 채 살아남았다. 이러한 신경망은 현대 AI를 강력하게 만드는 기반이지만, 그 원리를 이해하기 어려운 대상이기도 하다.

GPT4와 같은 대형언어모델(large language model)에 사용되는 기존의 인공 뉴런은 많은 데이터를 입력받아 입력값을 합산한 다음, 뉴런 ‘내부’에서 또 다른 수학적 연산을 수행하여 해당 합계를 출력값으로 변환한다. 신경망은 이러한 뉴런들의 결합으로 구성되기 때문에, 신경망에서 뉴런들이 함께 작동하는 방식을 해독하기가 어려울 수 있다.

그러나 뉴런을 결합하는 새로운 방법은 조금 다른 방식을 활용한다. 우선 기존 뉴런의 작동 원리를 복잡하게 만드는 과정 중 일부를 단순화하여 뉴런 ‘외부’로 이동시켰다. 그 결과 새로운 뉴런들은 내부에서 숨겨진 연산을 추가로 수행하지 않고 단순히 입력값만 합산하여 출력값을 생성한다. 이러한 새로운 뉴런들로 이루어진 신경망을 ‘콜모고로프-아르놀트 네트워크(Kolmogorov-Arnold Network, 이하 ‘KAN’)’라고 부르는데, 이는 이 방식을 고안하는 데 영감을 준 러시아 수학자의 이름을 딴 것이다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!