Zyphra, AMD 하드웨어로 훈련된 ZAYA1-8B 모델 출시

Zyphra가 새로운 추론 Mixture of Experts 모델인 ZAYA1-8B를 출시했다. 이 모델은 단 760M의 활성 파라미터를 가지고 있지만, 수학 및 코딩 벤치마크에서 그보다 훨씬 큰 오픈 웨이트 모델들을 능가하는 성능을 보여주고 있다. 특히, ZAYA1-8B는 DeepSeek-V3.2에 근접하며, HMMT’25에서 Claude 4.5 Sonnet을 초월하는 성과를 기록했다. 이 모델은 AMD Instinct MI300 하드웨어에서 엔드 투 엔드로 훈련되었으며, Apache 2.0 라이선스 하에 공개되었다. ZAYA1-8B는 소형 언어 모델의 새로운 지능 밀도 기준을 설정하고 있다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자