NVIDIA AI, Orchestrator-8B 발표: 효율적인 도구 및 모델 선택을 위한 강화 학습 훈련 컨트롤러

NVIDIA의 연구진은 ToolOrchestra라는 혁신적인 방법을 발표했습니다. 이는 각 작업 단계마다 올바른 모델 또는 도구를 선택하는 AI 시스템을 학습시키는 것을 목표로 합니다. 이를 통해 하나의 대규모 모델에만 의존하는 것이 아니라 작업에 적합한 도구 또는 모델을 선택할 수 있게 됩니다. 이는 heterogeneous tool-use agent의 ‘뇌’ 역할을 하는 작은 언어 모델을 훈련시키는 혁신적인 방법입니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자