구글 딥마인드, 비전 바나나 발표: 이미지 생성기 성능 향상

구글 딥마인드가 최근 발표한 연구에서 새로운 이미지 생성기인 ‘비전 바나나’를 소개했습니다. 이 기술은 이미지 생성 사전 훈련이 자연어 처리 분야에서의 GPT 스타일 사전 훈련과 유사한 중요성을 지닌다고 주장하고 있습니다. 연구 결과에 따르면, 비전 바나나는 SAM 3의 분할 성능과 Depth Anything V3의 메트릭 깊이 추정에서 뛰어난 성능을 보여주었습니다. 이러한 성과는 이미지 생성 기술이 컴퓨터 비전의 발전에 기여할 수 있는 가능성을 제시합니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자