2026년 6월 7일 일요일
오늘의 신문
2026년 6월 7일 일요일 오늘의 신문
VSAS-Bench: 실시간 비주얼 스트리밍 어시스턴트 모델 평가
발행일: 2026년 5월 22일 오전 12시 00분

비주얼 언어 모델(VLM)은 지시 프롬프트와 온라인 입력 프레임의 스트림을 바탕으로 지속적으로 응답을 생성합니다. 이는 실시간 비주얼 어시스턴트의 핵심 메커니즘입니다. 그러나 기존의 VLM 프레임워크는 주로 오프라인 환경에서 모델을 평가하는 데 집중해 왔습니다. 반면, 스트리밍 VLM의 성능은 단순한 비디오 이해를 넘어서는 추가적인 지표에 의존합니다. 여기에는 모델의 응답 적시성을 반영하는 ‘적극성’과 시간이 지남에 따라 응답의 일관성을 측정하는 ‘일관성’이 포함됩니다. 이러한 한계를 해결하기 위해, 우리는 VSAS-Bench라는 새로운 평가 프레임워크를 제안합니다.

<Apple 뉴스 본문 전체읽기>

출처: Apple
요약번역: 미주투데이 서현진 기자