2026년 3월 7일 토요일
오늘의 신문
2026년 3월 7일 토요일 오늘의 신문
Hugging Face, Smol2Operator 발표: 2.2B VLM을 Agentic GUI 코더로 훈련시키는 완전 오픈소스 파이프라인
발행일: 2025년 9월 26일 오후 4시 51분

Hugging Face (HF)가 Smol2Operator를 발표했다. 이는 UI 경험이 없는 작은 Vision-Language 모델(VLM)을 GUI 조작 및 도구 사용 에이전트로 전환하는 재현 가능한 레시피이다. 이 릴리스에는 데이터 변환 유틸리티, 훈련 스크립트, 변환된 데이터셋, 그리고 결과로 나온 2.2B-파라미터 모델 체크포인트가 포함되어 있으며, GUI 에이전트를 처음부터 구축하기 위한 완벽한 청사진으로 위치하고 있다. Smol2Operator는 작은 VLM을 강력한 GUI 코더로 변환하는 기능을 제공한다. 이는 AI 기술의 혁신적인 발전을 뒷받침하기 위한 중요한 발표로 평가되고 있다. 또한, 이 파이프라인은 완전히 오픈소스이며, 커뮤니티의 기여를 통해 계속 발전할 수 있다. 이 같은 레시피는 GUI 에이전트를 구축할 때 유용한 도구로 사용될 수 있을 것으로 기대된다. 또한, 이를 통해 UI 경험을 전혀 갖지 않은 모델들도 다양한 작업을 수행하고 상호작용할 수 있는 능력을 향상시킬 수 있다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자