MIT 연구: 감독된 미세 조정과 비교했을 때 강화 학습이 재앙적인 잊혀짐을 최소화하는 것을 보여줌
MIT의 새로운 연구에 따르면, 감독된 미세 조정에 비해 강화 학습이 재앙적인 잊혀짐을 최소화하는 것으로 나타났다. 재앙적인 잊혀짐은 새로운 작업에 대한 미세 조정이 이전에 학습한 능력을 상실하는 현상을 말한다. 이 한계는 오랫동안 유지되고 지속적으로 개선되는 AI 에이전트를 구축하는 데 장애물이 될 수 있다. 온라인 강화 학습이 왜 감독된 미세 조정보다 덜 잊어버릴까? MIT의 연구진은 이 질문에 대한 해답을 찾기 위해 노력했다. 해당 연구 결과는 AI 기술 발전에 새로운 통찰력을 제공할 수 있을 것으로 기대된다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자