2026년 3월 10일 화요일
오늘의 신문
2026년 3월 10일 화요일 오늘의 신문
VoXtream 만나보기: 첫 단어부터 말을 시작하는 실시간 사용을 위한 오픈소스 풀 스트림 제로샷 TTS 모델
발행일: 2025년 9월 23일 오전 5시 24분

KTH의 Speech, Music and Hearing 그룹이 개발한 VoXtream은 실시간 TTS(Text to Speech) 모델로, 사람이 음성을 듣기 전에 잠시의 침묵 없이 말을 시작한다. 기존의 “스트리밍” TTS 스택은 텍스트 덩어리를 기다렸다가 음성을 내지만, VoXtream은 이러한 문제를 해결하기 위해 개발되었다. 이 모델은 실시간 에이전트, 실시간 더빙, 동시 통역 등의 분야에서 혁명을 일으킬 것으로 예상된다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자