2026년 3월 7일 토요일
오늘의 신문
2026년 3월 7일 토요일 오늘의 신문
알리바바 큐윈 팀, 상용 GPU로 80B/3B-액티브 하이브리드-MoE를 가져오는 Qwen3-Next-80B-A3B의 FP8 빌드를 공개
발행일: 2025년 9월 22일 오전 6시 04분

알리바바의 큐윈 팀은 새로운 Qwen3-Next-80B-A3B 모델을 위한 FP8-양자화된 체크포인트를 공개했다. 이 모델은 두 가지 후 학습 변형인 Instruct와 Thinking이라는 이름으로, 초고 처리량 추론과 MoE 효율성을 위해 고안되었다. FP8 레포지토리는 BF16 릴리스를 반영하지만 “미세한 FP8” 가중치(블록 크기 128)와 sglang 및 vLLM 신변 빌드를 위한 배포 노트가 포장되어 있다. 이러한 모델의 성능은 벤치마크를 통해 확인할 수 있다.

<Mark Tech Post 뉴스 본문 전체읽기>

출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자