Neuphonic, NeuTTS Air 공개: 748M-파라미터 장치 내 음성 언어 모델 및 즉각 음성 복제
Neuphonic은 NeuTTS Air를 공개했다. 이는 로컬 CPU에서 실시간으로 실행되는 오픈소스 텍스트 음성 변환(TTS) 모델로, Hugging Face 모델 카드에는 748M 파라미터(Qwen2 아키텍처)가 나열되어 있으며, GGUF 양자화(Q4/Q8)로 제공되어 llama.cpp/llama-cpp-python을 통해 클라우드 의존성 없이 추론이 가능하다. Apache-2.0 하에 라이선스가 부여되었으며, 실행 가능한 데모가 함께 제공된다. Neuphonic의 NeuTTS Air는 음성 복제를 위한 모델로 활용될 수 있을 것이다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자