Trajectory, 지속 학습을 위한 동시 다중 LoRA 훈련 스택 발표
Trajectory는 UC 버클리 스카이랩 및 Anyscale과 협력하여 지속 학습을 위한 동시 다중 LoRA 훈련 스택을 발표했습니다. 이 새로운 시스템은 각 강화 학습(RL) 실험을 항상 활성화된 엔진의 전용 LoRA 어댑터에 매핑하여, 단일 테넌트 기준에 비해 실험 처리량을 2.81배 향상시키는 성과를 올렸습니다. 이 과정에서 보상 회귀는 발생하지 않았습니다. 또한, 이 훈련 스택의 코드는 NovaSky-AI/SkyRL에서 오픈 소스로 제공됩니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자