음성 모델 평가를 위한 분류 체계

음성 기술 모델은 최근 다양한 작업에서 놀라운 성능을 보여주고 있으나, 이러한 모델들의 평가는 여전히 작업과 모델 유형에 따라 분리되어 있다. 서로 다른 모델들은 음성 처리의 다양한 측면에서 뛰어나며, 따라서 서로 다른 평가 프로토콜이 필요하다. 이 논문은 어떤 모델에 어떤 평가가 적합한지에 대한 질문에 대한 통합적인 분류 체계를 제안한다. 이 분류 체계는 측정되는 평가 측면, 작업을 수행하기 위해 필요한 모델 기능, 그리고 수행해야 하는 작업 또는 프로토콜 요구 사항을 정의하는 세 가지 직교하는 축을 제시한다. 이를 통해 음성 모델의 평가에 대한 통일성과 명확성을 높일 수 있을 것으로 기대된다.
출처: Apple
요약번역: 미주투데이 서현진 기자