Now you can chat with ChatGPT using your voice

이제 챗GPT와 음성으로 대화한다

오픈AI가 챗GPT에 대한 대대적인 업그레이드를 통해 사람과 대화하듯 음성으로 소통하고, 이미지에 대해 물으면 음성으로 답을 듣게 해주는 기능을 추가했다. 구체적으로 어떤 기능들이고, 문제점은 없는지 등을 자세히 살펴봤다.

오픈AI가 대대적 업그레이드를 통해 사용자가 챗GPT와 더 원활하게 소통할 수 있는 두 가지 새로운 방법을 선보였다.

첫째, 이제 챗GPT가 목소리를 갖게 됐다. 사용자가 다섯 가지 실감 나는 합성 음성 중에 하나를 선택하면 마치 전화 통화하듯 챗GPT와 대화할 수 있다. 예를 들어, 음성으로 질문하면 실시간으로 음성으로 답변을 듣는 식이다.

둘째, 챗GPT는 이제 이미지에 대한 질문에도 답을 주기 시작했다. 오픈AI는 지난 3월 챗GPT의 기반이 되는 모델인 GPT-4를 공개하면서 이 기능이 들어갈 거라고 예고했지만, 지금껏 일반 대중에게 기능을 공개한 적은 없었다. 이제 챗GPT에 이미지를 업로드한 뒤에 이미지 내용에 대해 질문하면 챗GPT로부터 답을 얻을 수 있다.

이번 업데이트는 지난주 오픈AI의 이미지 생성 모델인 DALL-E 3의 최신 버전이 챗GPT에 연결되어 챗GPT가 사진을 생성할 수 있게 만들 것이라는 발표 직후 실시됐다.

챗GPT와의 음성 대화 기능은 두 가지 개별 모델에 의존한다. 하나는 오픈AI의 기존 음성-텍스트 변환 모델인 위스퍼(Whisper)다. 위스퍼는 사용자가 말한 내용을 텍스트로 변환하여 챗봇에 전달해준다. 두 번째는 새로운 텍스트 음성 변환 모델이다. 이것은 챗GPT가 내놓은 대답을 음성으로 변환해준다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!