2026년 3월 7일 토요일
오늘의 신문
2026년 3월 7일 토요일 오늘의 신문
Hugging Face, 새로운 비전-언어 모델 학습용 2천400만 샘플을 포함한 멀티모달 데이터셋 FineVision 오픈 소스화
발행일: 2025년 9월 6일 오전 4시 05분

Hugging Face가 FineVision을 공개했다. 이 데이터셋은 비전-언어 모델(VLMs) 학습을 위한 새로운 표준을 세우기 위해 설계된 오픈 소스 멀티모달 데이터셋이다. FineVision은 17.3백만 개의 이미지, 24.3백만 개의 샘플, 88.9백만 개의 질문-답변 쌍, 그리고 거의 100억 개의 응답 토큰을 포함하며, 공개적으로 이용 가능한 VLM 학습 데이터셋 중에서 가장 크고 구조화된 것으로 자리매김하고 있다. FineVision은 200개 이상의 다양한 데이터 소스에서 수집된 데이터를 집계하여 구성되어 있다. 이 데이터셋은 비전과 언어 간 상호 작용을 이해하고 이를 기반으로 모델을 훈련시키는 데 필요한 풍부한 정보를 제공한다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자