딥엠엠서치-R1: 멀티모달 웹 검색에서 멀티모달 LLMs에 전력을

실제 응용 프로그램에서 멀티모달 대형 언어 모델(MLLMs)은 외부 지식 원본에 액세스해야 하며 정보 탐색 및 지식 집약적 사용자 쿼리를 처리하기 위해 동적이고 끊임없이 변화하는 실세계 정보에 반응해야 합니다. 기존 방법들은 제한적인 파이프라인, 과도한 검색 호출 및 부적절한 검색 쿼리로 효율성과 최적화된 결과를 얻는 데 어려움을 겪습니다. 이러한 제한 사항을 해결하기 위해, 우리는 DeepMMSearch-R1이라는 새로운 모델을 제안합니다. DeepMMSearch-R1은 멀티모달 LLMs를 강화하기 위한 효과적인 방법으로, 검색 호출을 줄이고 적합한 검색 쿼리를 생성함으로써 기존 방법들의 제한 사항을 극복합니다. 이 모델은 실세계 정보에 대한 빠르고 정확한 응답을 제공하며, 정보 탐색 및 지식 집약적 사용자 쿼리에 효과적으로 대응할 수 있습니다.
출처: Apple
요약번역: 미주투데이 서현진 기자