음성-언어 사전훈련 개선을 위한 데이터 중심 수업

음성 질문-응답(SQA)은 유용하고 대화형 인공지능 시스템의 핵심 능력입니다. 최근 몇 년간 몇 가지 음성-언어 모델(SpeechLMs)이 출시되었는데, 이 모델들은 SQA 성능을 향상시키기 위해 특별한 초점을 맞추고 있습니다. 그러나 사전훈련 데이터 처리 및 선별에 대한 통제된 실험이 부족하여 성능을 설명하는 요인을 이해하는 데 어려움이 있습니다. 다른 데이터 모달리티에 대한 유사한 연구에서 얻은 결과에도 불구하고 이러한 공백을 채우기 위해 우리는 SpeechLMs의 사전훈련을 위해 데이터 중심적 탐구를 실시했습니다. 저희는 세 가지에 초점을 맞춰 조사했습니다.
출처: Apple
요약번역: 미주투데이 서현진 기자