
구글 챗GPT 대항마 ‘바드’ 출시, 창의적인 협력자 될까
검색 대기업 구글이 오픈AI의 챗GPT와 마이크로소프트의 빙챗(Bing Chat)에 대응하기 위한 챗봇 모델 ‘바드(Bard)’를 출시했다. 질문과 관련된 검색 결과를 찾아 답변하는 빙챗과 달리 바드는 검색 결과를 조회하지 않고 모든 정보를 자체 생성한다. 그러면서도 여전히 사용자의 브레인스토밍을 돕고 질문에 답할 수 있도록 설계되었다. 구글은 바드가 자사의 검색 경험에서 필수적인 요소가 되기를 바라고 있다.
3월 21일(현지 시각) 영국 런던의 구글 사무실에서 진행된 데모 라이브에서 바드는 토끼를 주제로 한 아이 생일 파티 아이디어를 제시하고 관엽식물을 돌보는 데 필요한 다양한 정보를 제공했다. 구글의 수석 제품 디렉터 잭 크로치크(Jack Krawczyk)는 “우리는 바드를 창의적인 협력자로 생각한다”고 말했다.
구글은 이번 출시에 큰 기대를 걸고 있다. 마이크로소프트는 오픈AI와 제휴를 맺고 검색 시장 1위인 구글의 자리를 차지하기 위해 공격적인 행보를 보였다. 이에 반해 구글은 첫 대응에서 실수를 범하고 말았다. 구글이 지난 2월 공개한 바드 티저 영상에서 바드가 답변 오류를 범하는 장면이 공개된 것이다. 구글의 주가는 하룻밤 사이에 1,000억 달러(한화 약 130조 6,600억 원)까지 하락했다.
구글은 바드의 작동 원리에 대한 상세 내용 대부분을 공개하지 않았다. 챗봇의 기반이 되는 기술인 대형 언어모델은 기업의 귀중한 지식자산(IP)이기 때문이다. 바드는 구글의 대표적인 대형 언어모델인 람다(LaMDA)의 새 버전을 기반으로 구축되었다. 구글은 기반 기술을 개선하면서 바드를 계속 업데이트할 예정이라고 밝혔다. 챗GPT나 GPT-4와 마찬가지로 바드는 사람의 피드백을 통한 강화 학습으로 미세 조정되며, 이를 통해 대형 언어모델은 더 유용하고, 덜 해로운 응답을 하도록 훈련받는다.
구글은 몇 달 동안 비공개로 바드를 개발해 왔지만, 아직 실험 중인 단계라고 말한다. 현재 구글은 대기자 명단에 등록한 미국과 영국인들을 대상으로 바드를 무료로 공개하고 있다. 초기 사용자들은 기술을 테스트하고 개선하는 데 도움을 줄 것이다. 구글의 리서치 담당 부사장 주빈 가라마니(Zoubin Ghahramani)는 “사용자 피드백을 받고 그 피드백을 기반으로 바드의 서비스 영역을 지속적으로 확대할 것이다”라며 “대형 언어모델에서 발생할 수 있는 모든 문제를 염두에 두고 있다”고 설명했다.
AI 스타트업 허깅페이스(Hugging Face)의 수석 윤리 과학자이자 구글 AI 윤리팀 공동 책임자로 일했던 마가렛 미첼(Margaret Mitchell)은 구글의 이러한 시각에 회의적이다. 그녀는 수년간 람다를 연구해온 구글이 바드를 ‘실험’이라고 포장하는 것은 “대기업이 수백만 명의 고객을 끌어들이기 위해 사용하는 일종의 홍보 수법이며 문제 발생 시 책임을 회피하기 위한 행위”라고 우려를 표했다.
구글은 사용자가 바드를 구글 검색의 대체제가 아니라 조력자로 인식하기를 바란다. 바드의 채팅 위젯 아래에는 ‘구글 검색하기(Google It)’ 버튼이 있다. 이는 사용자가 바드의 답변을 확인하거나 구글 검색으로 더 많은 정보를 찾도록 유도하기 위한 것이다. 크로치크는 “구글 검색 버튼은 기술의 한계를 상쇄하는 데 도움이 되는 요소 중 하나”라고 강조한다.
가라마니는 “우리는 (바드의) 답변이 확실하지 않다면 사람들이 실제로 다른 곳들을 탐색하고 확인하도록 권장하고 싶다”고 말한다.
바드의 결함에 대한 인식은 다른 방식으로 설계에 영향을 미쳤다. 사용자는 주어진 세션에서 바드와 제한적인 횟수의 상호작용만 가능하다. 이는 대형 언어모델이 한 번의 대화를 오래 끌수록 혼란스러운 대답을 할 가능성이 커지기 때문이다. 예를 들어 사람들이 빙챗이 이상한 응답을 내놓았다고 온라인에 공유한 경우의 상당수는 지루한 대화가 끝났을 때 나타난 것이었다.
구글은 출시 시 대화 횟수에 제한을 둘 것인지는 확인하지 않았지만, 출시 초기에는 대화 횟수를 상당히 낮게 설정하고, 이후 사용자 피드백에 따라 조절할 계획이다.

구글은 콘텐츠 측면에서도 안전에 전력을 기울이고 있다. 사용자는 성적으로 노골적인 자료나 불법적이거나 유해한 자료(구글이 판단했을 때) 또는 개인 정보를 요청할 수 없다. 데모에서 바드는 화염병 제조 방법에 대한 정보를 제공하지 않았다. 이처럼 유해 질문에 대한 답변을 거부하는 것은 현세대 챗봇의 표준이다. 그러나 바드는 암 징후를 발견하는 방법과 같은 의료 정보도 제공하지 않을 것이다. 크로치크는 이에 대해 “바드는 의사가 아니기에 의학적 조언을 제공하지 않을 것이다”라고 선을 그었다.
바드와 챗GPT의 가장 큰 차이는 바드가 모든 응답에 대해 세 가지 버전을 생성한다는 점이다. (구글은 이를 ‘초안(drafts)’이라고 부른다.) 사용자는 이 중 하나를 클릭해서 원하는 응답을 선택하거나 응답을 혼합해서 사용할 수 있다. 이는 바드가 완벽한 답변을 생성할 수 없다는 점을 사용자에게 상기시키기 위한 것이다. 크로치크는 “하나의 답변만 보여주면 권위적인 느낌이 들 수 있다”면서 “사실성에는 한계가 있다는 것을 알고 있다”고 덧붙였다.
데모에서 크로치크는 바드에 자녀의 생일 파티 초대장을 작성해달라고 요청했다. 바드는 캘리포니아주 산 라파엘(San Rafael)에 있는 짐 월드(Gym world, 2~15세 아이들에게 스포츠를 가르치는 클래스 운영 기관) 주소를 입력했다. 크로치크는 “자주 지나치는 곳이지만 거리 이름을 말할 수는 없다”라고 말했다. 크로치크는 “그래서 구글 검색이 여기서부터 시작되는 것”이라며 주소가 정확한지 확인하기 위해 ‘구글 검색하기(Google It)’를 클릭했다.
크로치크는 구글이 당장은 검색을 대체하고 싶어 하지 않는다고 말한다. 그는 “우리는 수십 년간 검색 경험을 완성하기 위해 노력했다”고 말한다. 하지만 이는 장기적인 전략이라기보다 현재 바드의 한계를 보여주는 신호일 수 있다. 구글은 발표에서 “앞으로 더 깊이 있는 방식으로 검색에 대형 언어모델을 신중하게 통합할 것이다”라고 말했다.
구글이 오픈AI, 마이크로소프트 및 기타 경쟁업체들과 확장 경쟁을 벌이고 있으므로 이런 통합은 머지않아 이루어질 수 있다. 워싱턴 대학교에서 검색 기술을 연구하는 치라그 샤(Chirag Shah)는 “구글은 기술 준비 상태와 관계없이 이 분야에 계속해서 뛰어들 것이다”라며 “챗GPT가 빙(Bing)과 다른 마이크로소프트 제품에 통합되는 것을 본 이상 구글도 똑같이 할 수밖에 없다”고 강조한다.
샤는 1년 전, 워싱턴 대학교에서 대형 언어모델을 연구하는 언어학자 에밀리 벤더(Emily Bender)와 함께 대형 언어모델을 검색 엔진과 결합할 때 생기는 문제점을 지적하는 논문을 공동 집필했다. 당시에는 이 아이디어가 여전히 가설에 불과해 보였다. 샤는 연구가 너무 앞서나간 것은 아닌지 걱정했다고 토로한다.
하지만 이 실험적인 기술은 전례 없는 속도로 소비자 대상 제품에 통합되었다. 샤는 “이런 일이 이렇게 빨리 일어날 거라고 예상하지 못했다”며 “이제는 선택의 여지가 없다. 테크 기업들은 자신들의 영역을 방어해야 한다”라고 말했다.