Llama 3의 추론력을 포스트 트레이닝만으로 향상시킬 수 있을까? ASTRO는 +16% ~ +20% 벤치마크 향상을 보여줘

발행일: 2025년 7월 4일 오후 1시 19분

Meta AI와 Washington 대학의 연구진은 대규모 언어 모델(Large Language Models, LLMs)의 추론 능력을 구조적 변화 없이 향상시키는 것이 AI 정렬과 사용성을 발전시키는 핵심 과제라고 말한다. 그들은 Llama-3.1-70B-Instruct에서 추론을 향상시키기 위한 새로운 포스트 트레이닝 프레임워크인 ASTRO(자동 회귀 검색 가르치는 추론기)를 소개했다. ASTRO는 모델이 컨텍스트 내 검색을 수행하도록 가르치는 독특한 방식으로, Llama 3의 추론 능력을 향상시키는데 기여한다.

#AI논문요약 #AI요약 #기계학습 #기술뉴스 #어플리케이션 #언어모델 #인공지능

출처: Mark Tech Post

요약번역: 미주투데이 김지호 기자