NVIDIA, 자연스럽고 풀 더플렉스 대화를 위한 PersonaPlex-7B-v1 발표

NVIDIA의 연구진이 PersonaPlex-7B-v1을 발표했다. 이 모델은 자연스러운 음성 상호작용을 위한 풀 더플렉스 대화 모델로, 정확한 페르소나 제어를 목표로 한다. 이 모델은 ASR(자동 음성 인식)에서 LLM(언어 모델)을 거쳐 TTS(텍스트 음성 변환)까지의 과정을 단일 풀 더플렉스 모델로 진화시켰다. 기존의 음성 어시스턴트는 ASR이 음성을 텍스트로 변환하고, 언어 모델이 텍스트 답변을 생성한 후, 이를 다시 텍스트에서 음성으로 변환하는 방식을 사용한다. PersonaPlex-7B-v1은 이러한 복잡한 과정을 단일 모델로 처리해 자연스럽고 효율적인 음성 대화를 가능하게 한다.
#AIShorts #Applications #ArtificialIntelligence #AudioLanguageModel #EditorsPick #LanguageModel #NewReleases #OpenSource #Sound #TechNews #Technology #TTS
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자