DeepSeek AI, 인쇄물 이해를 위한 레이아웃 인식 OCR을 발표

DeepSeek AI가 DeepSeek-OCR 2를 공개했습니다. 이 시스템은 오픈 소스 문서 OCR 및 이해 시스템으로, 복잡한 문서를 사람들이 스캔하는 방식에 더 가까운 인과적 순서로 페이지를 읽을 수 있도록 구조화합니다. 이 시스템의 주요 구성 요소는 2D 페이지를 1D 시퀀스로 변환하는 언어 모델 스타일의 트랜스포머인 DeepEncoder V2입니다. DeepSeek-OCR 2는 레이아웃을 고려한 문서 이해를 위한 혁신적인 도구로 소개되었습니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자