Qwen 연구진, Qwen3-TTS 공개: 실시간 지연 및 세밀한 음성 제어를 갖춘 오픈 멀티링구얼 TTS 스위트

알리바바 클라우드의 Qwen 팀은 Qwen3-TTS를 공개했다. Qwen3-TTS는 음성 클론, 음성 디자인, 고품질 음성 생성이라는 3가지 핵심 작업을 하나의 스택으로 대상으로 하는 멀티링구얼 텍스트 음성 모델 패밀리이다. Qwen3-TTS는 12Hz 음성 토크나이저와 2개의 언어 모델 크기(0.6B, 1.7B)를 사용하며, 3가지 주요 작업으로 패키징되어 있다. 이 오픈소스 모델은 실시간 지연 및 세밀한 음성 제어 기능을 제공한다.
#AIShorts #Applications #ArtificialIntelligence #AudioLanguageModel #EditorsPick #NewReleases #Sound #TechNews #Technology #TTS #VoiceAI
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자