NVIDIA, 새로운 AI 프레임워크 PivotRL 발표
NVIDIA는 최근 새로운 AI 프레임워크인 PivotRL을 발표했습니다. 이 프레임워크는 소프트웨어 엔지니어링, 웹 브라우징, 복잡한 도구 사용과 같은 장기 에이전틱 작업을 위한 것입니다. 기존의 감독 세부 조정(Supervised Fine-Tuning, SFT) 방식은 계산 효율성은 높지만, 종종 도메인 외 성능 저하를 겪고 훈련 분포를 넘어 일반화하는 데 어려움을 겪습니다. 반면, 엔드 투 엔드 강화 학습(end-to-end reinforcement learning, E2E)은 이러한 문제를 해결할 수 있는 가능성을 보여줍니다. PivotRL은 이러한 접근 방식을 통해 4배 적은 롤아웃 턴으로 높은 정확도를 달성할 수 있도록 설계되었습니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자