NVIDIA, 오디오 일반 지능 발전을 위한 오픈소스 모델 ‘Audio Flamingo 3’ 출시

NVIDIA가 Audio Flamingo 3 (AF3)를 발표했다. 이는 인공 일반 지능(AGI)의 청각 상반되는 개념인 Audio General Intelligence를 소개한다. AF3은 기계가 소리를 이해하고 추론하는 방식에 큰 발전을 이끌어냈다. 과거 모델들은 음성을 전사하거나 오디오 클립을 분류할 수는 있었지만, AF3는 음성, 주변 소리 등을 인간과 유사한 맥락에서 해석하는 능력을 갖췄다. 이 모델은 사람의 대화를 듣고 정확하게 이해하여 상호작용할 수 있게끔 설계되었다. NVIDIA는 AF3를 오픈소스로 제공하여 누구나 활용할 수 있게끔 하였다. 이러한 발전으로 기술과 혁신이 더욱 가속화될 것으로 전망된다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자