Apple researchers explore dropping “Siri” phrase & listening with AI instead
“시리야” 안 해도 된다?…애플, AI로 새로운 시리 활성법 연구 중
애플이 "시리야” 같은 트리거 문구가 없어도 AI 모델이 사용자가 언제 휴대폰에 지시하고 있는지를 판단해 시리를 작동시킬 수 있는지 알아보는 테스트를 진행 중이다.
현재는 아이폰 사용자가 음성비서인 시리(Siri) 기능을 이용하려면 “시리야”라고 불러야 한다.
그런데 애플 연구원들이 인공지능(AI)을 활용해서 “시리야” 같은 ‘트리거 문구’를 쓰지 않고도 시리 기능을 활성화시키는 게 가능한지 여부를 알아보고 있는 것으로 22일(현지시간) 발표된 연구 논문을 통해 확인됐다.
아직 동료 평가를 거치지는 않은 이 연구에서 연구원들은 스마트폰에서 캡처한 음성과 배경 소음에 관한 음향 데이터를 모두 사용해 대형언어모델(LLM)을 학습시켜 사용자가 언제 기기의 도움을 원하는지 알아낼 수 있는 패턴을 찾아냈다.
연구진은 “이 모델이 상대적으로 가볍고 스마트폰과 같은 기기에서 실행될 수 있어 부분적으로 오픈AI(OpenAI)의 GPT-2 버전으로 구축됐다”고 밝혔다.
단, 논문에는 129시간이 넘는 분량의 데이터와 모델 학습에 사용된 추가 텍스트 데이터에 대한 설명은 들어있지만, LLM의 학습에 사용된 녹음 소스는 명시되어 있지 않다.
7명의 논문 저자 중 6명은 자신이 애플에 소속되어 있다고 기재했으며, 링크드인(LinkedIn) 프로필상으로는 그중 3명은 시리팀에서 일하고 있는 것으로 확인됐다. (일곱 번째 저자는 애플의 인턴십 기간 중 논문과 관련된 업무를 수행했다.)
논문에 따르면 일단 테스트 결과는 긍정적이었다. 학습한 LLM은 오디오 전용 모델이나 텍스트 전용 모델보다 더 정확히 사용자가 도움을 원하는 시기를 예측할 수 있었다. 또 모델의 크기가 커질수록 정확도는 더욱 향상됐다.