구글이 제안하는 TUMIX: 도구 사용 혼합을 통한 다중 에이전트 테스트 시간 스케일링
구글 클라우드 AI 연구팀은 MIT, 하버드 및 Google DeepMind 협력자들과 함께 TUMIX(도구 사용 혼합)를 소개했습니다. 이는 이질적인 에이전트 스타일(텍스트 전용, 코드, 검색, 가이드된 변형)을 앙상블하는 테스트 시간 프레임워크입니다. 이 프레임워크는 에이전트들이 노트를 공유하고 일찍 중단할 수 있도록 하는 것을 통해 HLE(Heterogeneous Leaderboard Evaluation)에서 Gemini-2.5 Pro를 34.1%까지 향상시킬 수 있습니다. TUMIX는 다중 에이전트 테스트 시간 스케일링을 위한 혁신적인 방법을 제시합니다.
#AgenticAI #AIAgents #AIPaperSummary #AIShorts #Applications #ArtificialIntelligence #EditorsPick #LanguageModel #LargeLanguageModel #Machinelearning #TechNews #Technology
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자