LLMs에서의 분수적 추론: 추론 깊이 제어하는 새로운 방법

현재 LLMs의 테스트 시간 계산 전략의 한계와 이에 대한 대안으로써 나온 Fractional Reasoning (FR)에 대해 새로운 연구가 소개되었습니다. FR은 훈련이 필요 없고 모델에 중립적인 프레임워크로, 추론 프롬프트와 조정 가능한 스케일링을 사용하여 잠재 상태를 조작하는 기술을 제공합니다. GSM8K, MATH500, GPQA 등의 데이터셋을 활용하여 너비와 깊이 기반 스케일링의 이점을 시연하였고, 다수 투표 및 최고 성능 모델에 비해 FR의 우수성을 입증했습니다. 이러한 결과 및 분석은 논문에서 자세히 다루어졌습니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자