LLM-Pruning Collection: 구조화 및 비구조화 LLM 압축을 위한 JAX 기반 레포
Zlab Princeton의 연구진은 LLM-Pruning Collection을 발표했습니다. 이는 대형 언어 모델을 위한 주요 가지치기 알고리즘을 하나로 통합한 JAX 기반 저장소입니다. 이 프로젝트는 일관된 훈련 및 평가 스택에서 GPU 및 CPU에서 블록 수준, 레이어 수준 및 가중치 수준 가지치기 방법을 비교하기 쉽게 합니다. 이 저장소를 사용하면 다양한 가지치기 기법을 구현하고 실험할 수 있습니다. 자세한 내용은 해당 링크에서 확인할 수 있습니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자