Apple researchers explore dropping “Siri” phrase & listening with AI instead

“시리야” 안 해도 된다?…애플, AI로 새로운 시리 활성법 연구 중

애플이 "시리야” 같은 트리거 문구가 없어도 AI 모델이 사용자가 언제 휴대폰에 지시하고 있는지를 판단해 시리를 작동시킬 수 있는지 알아보는 테스트를 진행 중이다.

현재는 아이폰 사용자가 음성비서인 시리(Siri) 기능을 이용하려면 “시리야”라고 불러야 한다.

그런데 애플 연구원들이 인공지능(AI)을 활용해서 “시리야” 같은 ‘트리거 문구’를 쓰지 않고도 시리 기능을 활성화시키는 게 가능한지 여부를 알아보고 있는 것으로 22일(현지시간) 발표된 연구 논문을 통해 확인됐다.

아직 동료 평가를 거치지는 않은 이 연구에서 연구원들은 스마트폰에서 캡처한 음성과 배경 소음에 관한 음향 데이터를 모두 사용해 대형언어모델(LLM)을 학습시켜 사용자가 언제 기기의 도움을 원하는지 알아낼 수 있는 패턴을 찾아냈다.

연구진은 “이 모델이 상대적으로 가볍고 스마트폰과 같은 기기에서 실행될 수 있어 부분적으로 오픈AI(OpenAI)의 GPT-2 버전으로 구축됐다”고 밝혔다.

단, 논문에는 129시간이 넘는 분량의 데이터와 모델 학습에 사용된 추가 텍스트 데이터에 대한 설명은 들어있지만, LLM의 학습에 사용된 녹음 소스는 명시되어 있지 않다.

7명의 논문 저자 중 6명은 자신이 애플에 소속되어 있다고 기재했으며, 링크드인(LinkedIn) 프로필상으로는 그중 3명은 시리팀에서 일하고 있는 것으로 확인됐다. (일곱 번째 저자는 애플의 인턴십 기간 중 논문과 관련된 업무를 수행했다.)

논문에 따르면 일단 테스트 결과는 긍정적이었다. 학습한 LLM은 오디오 전용 모델이나 텍스트 전용 모델보다 더 정확히 사용자가 도움을 원하는 시기를 예측할 수 있었다. 또 모델의 크기가 커질수록 정확도는 더욱 향상됐다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!