Fish Audio가 Fish Audio S2를 출시하며 감정을 엄청나게 제어할 수 있는 혁신적인 텍스트 음성 변환(TTS)의 새로운 세대를 선보임
Fish Audio는 텍스트 음성 변환(TTS)의 지형이 모듈식 파이프라인에서 통합형 대형 오디오 모델(LAMs)로 이동하고 있다는 점에 대해 최근 주목을 받고 있습니다. Fish Audio가 출시한 S2-Pro는 Fish Speech 생태계 내에서의 플래그십 모델로, 고품질의 다중 화자 합성과 150ms 미만의 대기 시간을 갖춘 오픈 아키텍처로의 전환을 대표합니다. 이 릴리스는 제로샷 보이스 클로닝과 세밀한 음성 복제를 위한 프레임워크를 제공하여 사용자들에게 감정을 엄청나게 제어할 수 있는 새로운 경험을 제공합니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자