DeepMind’s new chatbot uses Google searches plus humans to give better answers

딥마인드, 대화 ‘질’ 크게 개선한 새 AI 챗봇 선보여…비결은?

딥마인드가 사람의 피드백을 바탕으로 학습한 뒤 인터넷 검색을 통해 찾아낸 정보로 답변의 근거를 제시하는 새로운 챗봇을 개발했다.

사람이 행동 방법을 알려주고 답변 시 인터넷 검색 결과를 활용하게 했더니 AI 챗봇의 답변 질이 크게 개선된 것으로 나타났다.

알파벳(Alphabet) 산하 인공지능(AI) 연구소 딥마인드(DeepMind)가 22일(현지시간) 발표한 새 논문에 따르면 연구팀은 딥마인드의 대형언어모델 친칠라(Chinchilla)를 이용해서 학습한 AI 챗봇 스패로(Sparrow)를 공개했다.

스패로는 실시간 구글 검색이나 정보를 활용해 인간과 대화하고 질문에 답하도록 만들어진 챗봇으로, 인터넷에서 적절한 대답을 찾아낸 후 대답의 유용성에 대해 사람들의 평가를 받는 방식으로 학습시켰다. 이는 특정 목표를 달성하기 위해 시행착오를 통해 학습하는 ‘강화학습(reinforcement learning)’ 알고리즘을 사용해 학습시켰다는 의미다. 연구팀은 사람들에게 자신이나 타인에게 해를 가하도록 유도하는 문제를 일으키지 않고 사람들과 안전하게 대화할 수 있는 AI를 개발하기 위해 이런 방법을 착안했다.

MIT 테크놀로지 리뷰와 함께, 미래를 앞서가세요 !!
한달에 커피 2잔값으로 즐기기
온라인 멤버
지면 매거진 멤버
(온라인+지면) 프리미엄 멤버

유료회원 플랜 보기 회원이면 로그인하기 회원가입

회원 가입 후 유료 구독 신청을 하세요 !!