2026년 3월 7일 토요일
오늘의 신문
2026년 3월 7일 토요일 오늘의 신문
Meta와 뉴욕대학교의 새로운 AI 방법, 반 온라인 강화 학습을 사용하여 LLM 정렬 향상
발행일: 2025년 7월 6일 오후 6시 05분

Meta와 뉴욕대학교가 개발한 새로운 AI 방법은 반 온라인 강화 학습을 활용하여 대형 언어 모델(Large Language Model, LLM)의 정렬을 향상시킨다. 대형 언어 모델은 인간 사용을 최적화하기 위해 추가 정렬이 필요한데, 이를 위해 강화 학습이 중요한 역할을 한다. 강화 학습은 모델이 인간 피드백이나 작업 기반 정확성에 따라 결정을 내릴 수 있게 함으로써 모델을 미세 조정하여 더 밀접하게 정렬할 수 있도록 돕는다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자