2026년 3월 7일 토요일
오늘의 신문
2026년 3월 7일 토요일 오늘의 신문
스탠포드 연구진이 소개한 MedAgentBench: 의료 AI 에이전트를 위한 현실 세계 벤치마크
발행일: 2025년 9월 16일 오전 3시 24분

스탠포드 대학 연구진은 MedAgentBench를 발표했다. 이는 의료 분야에서 대형 언어 모델 (LLM) 에이전트를 평가하기 위해 설계된 새로운 벤치마크 스위트이다. 이전의 질의응답 데이터셋과는 달리 MedAgentBench는 AI 시스템이 상호 작용, 계획 및 다단계 임상 작업을 실행해야 하는 가상 전자 건강 기록 (EHR) 환경을 제공한다. 이는 AI 시스템을 테스트하는 방식에서 상당한 변화를 가져왔다. 이러한 혁신적인 벤치마크는 의료 AI 에이전트의 성능을 평가하는 데 중요한 역할을 할 것으로 예상된다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자