2026년 3월 7일 토요일
오늘의 신문
2026년 3월 7일 토요일 오늘의 신문
Qwen 연구진, Qwen3-TTS 공개: 실시간 지연 및 세밀한 음성 제어를 갖춘 오픈 멀티링구얼 TTS 스위트
발행일: 2026년 1월 23일 오전 1시 26분

알리바바 클라우드의 Qwen 팀은 Qwen3-TTS를 공개했다. Qwen3-TTS는 음성 클론, 음성 디자인, 고품질 음성 생성이라는 3가지 핵심 작업을 하나의 스택으로 대상으로 하는 멀티링구얼 텍스트 음성 모델 패밀리이다. Qwen3-TTS는 12Hz 음성 토크나이저와 2개의 언어 모델 크기(0.6B, 1.7B)를 사용하며, 3가지 주요 작업으로 패키징되어 있다. 이 오픈소스 모델은 실시간 지연 및 세밀한 음성 제어 기능을 제공한다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자