2026년 3월 8일 일요일
오늘의 신문
2026년 3월 8일 일요일 오늘의 신문
SO-Bench: 다중 모달 LLM의 구조적 출력 평가
발행일: 2025년 12월 5일 오전 12시 00분

다중 모달 대형 언어 모델(MLLMs)은 실제 현장에서 점진적으로 적용되고 있으며, 출력물은 올바를 뿐만 아니라 사전 정의된 데이터 스키마에도 준수해아 합니다. 텍스트 영역에서의 구조화된 생성에 대한 최근 진전에도 불구하고, 시각적 입력에 대한 스키마 기반 정보 추출과 추론을 체계적으로 평가하는 벤치마크는 아직 없습니다. 본 연구에서는 저희가 주의 깊게 설계한 SO-Bench 벤치마크를 사용하여 MLLMs의 시각적 구조적 출력 능력에 대한 포괄적인 연구를 진행합니다. UI 화면, 자연 이미지 등 네 가지 시각적 도메인을 다루고 있습니다.

<Apple 뉴스 본문 전체읽기>

출처: Apple
요약번역: 미주투데이 서현진 기자