‘Kani-TTS-2’ 만나보세요: 3GB VRAM에서 실행되는 400M 파라미터 오픈 소스 텍스트 음성 변환 모델
음성 생성 분야에서의 풍경은 효율성으로 변화하고 있다. nineninesix.ai 팀이 출시한 새로운 오픈 소스 ‘Kani-TTS-2’는 무겁고 컴퓨팅 비용이 많이 드는 TTS 시스템과 달리 작은 용량으로 고품질 음성 합성을 제공한다. ‘Kani-TTS-2’는 음성을 언어로 취급하여 탁월한 성능의 스피치 신합을 실현한다. 또한 음성 복제 기능을 지원하여 lean하고 높은 성능을 가진 대안을 제공한다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자