
Stuart Bradford
Meet the new biologists treating LLMs like aliens
새로운 생물학자들의 등장
대형언어모델을 컴퓨터 프로그램이 아닌 외계 생명체처럼 연구함으로써, 그 내부에 숨겨진 가장 핵심적인 비밀들이 하나씩 드러나고 있다.
대형언어모델(LLM)은 얼마나 클까? 이렇게 상상해 보자.
샌프란시스코 중심부에는 트윈 픽스라는 언덕이 있는데, 그곳에 서면 도시의 거의 모든 구역을 내려다볼 수 있다. 거기서 보이는 모든 거리와 교차로, 동네와 공원까지, 시야에 들어오는 전부가 종이로 덮여 있다고 생각해보자. 그리고 그 종이 위에 숫자가 빼곡히 적혀 있다고 상상해 보라.
이것이 적어도 중형 규모 이상의 언어모델을 시각화하는 한 가지 방법이다. 14포인트 글씨로 인쇄한다고 할 때, 2024년 오픈AI가 공개한 GPT4o처럼 2천억 개의 매개변수를 가진 모델은 약 119㎢에 달하는 종이를 채울 수 있다. 가장 큰 모델의 경우 로스앤젤레스 전체를 덮을 정도다.
우리는 이제 너무나 거대하고 복잡해서 아무도 정확히 이해할 수 없는 기계와 함께 살아가고 있다. 그것이 무엇인지, 어떻게 작동하는지, 실제로 무엇을 할 수 있는지 정확히 아는 사람은 없다. 심지어 이를 개발한 사람들조차 마찬가지다. 오픈AI의 댄 모싱(Dan Mossing) 연구과학자는 “인간의 뇌로는 결코 완전히 파악할 수 없다”고 말했다.
문제는 바로 여기에 있다. 아무도 이 기술이 정확히 어떻게 작동하는지, 그 한계가 무엇인지 완전히 이해하지 못하는데도, 오늘날 수억 명이 매일 이 기술을 사용하고 있다는 점이다. 모델이 왜, 어떤 이유로 특정한 답변을 내놓는지 모른다면 환각을 통제하거나 효과적인 안전장치를 마련하기 어렵다. 또한 이 기술을 언제 신뢰하고, 또 언제 경계해야 하는지 판단하기도 쉽지 않다.