인공지능 AI benchmarks are broken. Here’s what we need instead. [OPINION] 이제 AI를 보는 기준을 바꿔야 한다 AI가 높은 벤치마크 점수에도 불구하고 실제 현장에서는 기대만큼의 성과를 내지 못하는 경우가 많다. 이에 따라 인간과 조직 맥락을 반영한 새로운 평가 방식이 필요하다는 지적이 나온다.