'Kani-TTS-2' 만나보세요: 3GB VRAM에서 실행되는 400M 파라미터 오픈 소스 텍스트 음성 변환 모델

‘Kani-TTS-2’ 만나보세요: 3GB VRAM에서 실행되는 400M 파라미터 오픈 소스 텍스트 음성 변환 모델

발행일: 2026년 2월 15일 오전 3시 17분

음성 생성 분야에서의 풍경은 효율성으로 변화하고 있다. nineninesix.ai 팀이 출시한 새로운 오픈 소스 ‘Kani-TTS-2’는 무겁고 컴퓨팅 비용이 많이 드는 TTS 시스템과 달리 작은 용량으로 고품질 음성 합성을 제공한다. ‘Kani-TTS-2’는 음성을 언어로 취급하여 탁월한 성능의 스피치 신합을 실현한다. 또한 음성 복제 기능을 지원하여 lean하고 높은 성능을 가진 대안을 제공한다.

#AgenticAI #ArtificialIntelligence #AudioLanguageModel #EditorsPick #Technology #TTS #VoiceAI

출처: Mark Tech Post

요약번역: 미주투데이 김지호 기자