ServiceNow AI Research, 현실적인 기업 심층 연구 벤치마크 ‘DRBench’ 공개
ServiceNow Research은 DRBench를 출시했습니다. 이는 “심층 연구” 에이전트를 평가하기 위한 벤치마크 및 실행 환경으로, 공개 웹과 기업 내부 데이터를 종합적으로 활용하여 올바르게 인용된 보고서를 작성하는 기업 과제에 대해 테스트할 수 있습니다. DRBench는 기업 스타일의 다양한 워크플로우를 구현하는데, 파일, 이메일, 채팅 로그, 클라우드 저장소 등을 포함하며, 에이전트는 이러한 자료들을 검색, 필터링하고 속성을 할 수 있어야 합니다. 이러한 과제는 웹만 사용하는 벤치마크와는 달리 더 복합적이고 현실적인 환경에서 수행됩니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자