2026년 3월 7일 토요일
오늘의 신문
2026년 3월 7일 토요일 오늘의 신문
바이트댄스 연구진, VGR 소개: 향상된 세밀한 시각 지각 능력을 갖춘 신형 다중언어 대규모 언어 모델 (MLLM)
발행일: 2025년 6월 25일 오전 3시 39분

바이트댄스 연구진이 VGR을 소개하면서, 다중언어 모델이 시각과 텍스트 정보를 결합하여 판단하고 질문에 답하는데 중요한 역할을 한다고 강조했다. 이 모델은 차트 해석, 이미지 기반 질문에 대답, 복잡한 시각 문서 이해에 효과적이다. VGR은 세밀한 시각 지각 능력을 향상시키는 데 중점을 두고 있어, 다양한 시각-언어 작업에 활용될 것으로 기대된다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자