구글, 실시간 멀티모달 음성 모델 ‘제미니 3.1 플래시 라이브’ 공개

구글이 AI 스튜디오의 제미니 라이브 API를 통해 개발자들을 위한 ‘제미니 3.1 플래시 라이브’를 미리 공개했습니다. 이 모델은 저지연의 자연스럽고 신뢰할 수 있는 실시간 음성 상호작용을 목표로 하며, 구글의 최고 품질 음성 및 오디오 모델로 평가받고 있습니다. 제미니 3.1 플래시 라이브는 멀티모달 스트림을 본격적으로 처리할 수 있는 기능을 제공하여, AI 에이전트를 위한 다양한 응용 프로그램 개발에 기초가 될 수 있습니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자