Llama 3의 추론력을 포스트 트레이닝만으로 향상시킬 수 있을까? ASTRO는 +16% ~ +20% 벤치마크 향상을 보여줘

Meta AI와 Washington 대학의 연구진은 대규모 언어 모델(Large Language Models, LLMs)의 추론 능력을 구조적 변화 없이 향상시키는 것이 AI 정렬과 사용성을 발전시키는 핵심 과제라고 말한다. 그들은 Llama-3.1-70B-Instruct에서 추론을 향상시키기 위한 새로운 포스트 트레이닝 프레임워크인 ASTRO(자동 회귀 검색 가르치는 추론기)를 소개했다. ASTRO는 모델이 컨텍스트 내 검색을 수행하도록 가르치는 독특한 방식으로, Llama 3의 추론 능력을 향상시키는데 기여한다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자