NVIDIA, Nemotron 3 Ultra 출시: 550B 혼합 전문가 하이브리드 모델

NVIDIA는 최근 Nemotron 3 Ultra를 출시했습니다. 이 모델은 총 550B의 파라미터를 가진 오픈 Mixture-of-Experts 하이브리드 Mamba-Transformer로, 55B의 활성 파라미터를 포함하고 있습니다. Nemotron 3 Ultra는 1M 토큰의 컨텍스트를 지원하며, 유사한 오픈 LLM보다 최대 6배 높은 추론 처리량을 제공하면서도 정확도는 동등한 수준을 유지합니다. 이 모델은 OpenMDW-1.1에 따라 오픈 가중치, 훈련 데이터 및 레시피와 함께 제공됩니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자