메타 AI 연구진, MapAnything 공개: 이미지로부터 직접 회귀되는 3D 장면 지오메트리
Meta AI 연구진은 Meta Reality Labs와 Carnegie Mellon University의 연구팀이 MapAnything을 소개했습니다. 이는 이미지와 선택적 센서 입력으로부터 직접 3D 장면 지오메트리를 회귀시키는 end-to-end transformer 아키텍처입니다. MapAnything은 Apache 2.0 하에 전체 훈련 및 벤치마킹 코드와 함께 공개되었으며, 12가지 이상의 다양한 3D 비전을 지원하면서 전문 파이프라인을 넘어섰습니다. 이 프로젝트는 전문가 수준의 지도 파이프라인을 대체하고, 이미지와 선택적 센서 입력을 통해 곧바로 3D 장면 지오메트리를 회귀시키는 혁신적인 방법을 제시합니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자