FlashLabs 연구원들, Chroma 1.0 공개: 개인화 음성 클로닝을 지원하는 4B 실시간 음성 대화 모델

FlashLabs 연구원들이 Chroma 1.0을 발표했습니다. Chroma 1.0은 오디오를 입력으로 받아들이고 출력으로 반환하는 실시간 음성-음성 대화 모델입니다. 이 모델은 다중 턴 대화에서 스피커 식별을 유지하며, 저지연 상호작용과 고품질의 개인화된 음성 클로닝을 결합한 최초의 오픈 소스 음성 대화 시스템으로 소개됩니다. 이 모델은 4B 크기로 제공되며, 음성 대화 시스템에서 실시간 대화를 가능하게 합니다. Chroma 1.0은 AI 기술을 활용하여 음성 대화의 품질과 사용자 경험을 향상시키는 데 기여할 것으로 기대됩니다.
#AgenticAI #AIAgents #AIPaperSummary #AIShorts #Applications #ArtificialIntelligence #AudioLanguageModel #EditorsPick #LanguageModel #LargeLanguageModel #Machinelearning #NewReleases #OpenSource #SoftwareEngineering #Sound #TechNews #Technology
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자