구글, Gemini 3.1 Flash TTS 출시: 표현력과 제어 가능성을 갖춘 AI 음성의 새로운 기준
구글이 최근 Gemini 3.1 Flash TTS라는 새로운 텍스트-음성 변환(TTS) 모델을 발표했습니다. 이 모델은 음성 품질을 개선하고, 표현력을 높이며, 다국어 생성 능력을 강화하는 데 중점을 두고 개발되었습니다. 이전 버전들이 단순한 변환에 초점을 맞췄다면, 이번 출시에서는 자연어 오디오 태그를 활용하여 보다 자연스러운 음성을 생성할 수 있도록 설계되었습니다. 또한, 70개 이상의 언어를 원활하게 지원하며, 다중 화자 대화 기능도 제공하여 다양한 상황에서의 활용 가능성을 높였습니다. 이러한 변화는 기존의 ‘블랙박스’ 방식의 음성 생성에서 벗어나, 사용자에게 더 많은 제어와 표현력을 제공하는 방향으로 나아가고 있음을 보여줍니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자