AbstRaL: LLM에 추상적 추론 가르치기, GSM 벤치마크에서 강건성 향상을 위해

최근 연구에 따르면, 특히 작은 LLM은 강건한 추론에 어려움을 겪는다. 그들은 익숙한 질문에 대해 잘 수행하지만, 이름이나 숫자를 바꾸거나 관련 없는 정보를 추가하는 등 약간만 변경되어도 성능이 떨어지는 경향이 있다. 이러한 취약성인 out-of-distribution (OOD) 일반화의 저하는 주목할만한 정확도 하락으로 이어진다. AbstRaL은 LLM에 추상적 추론을 가르치기 위해 강화 학습을 이용하여 GSM 벤치마크에서 강건성을 향상시킨다. (텍스트의 저작권은 해당 링크에 있습니다.)
#AIPaperSummary #Applications #ArtificialIntelligence #EditorsPick #LanguageModel #Machinelearning #NewReleases #TechNews #Technology
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자