구글 AI, Gemma 4를 위한 다중 토큰 예측 드래프터 발표

구글이 최근 Gemma 4 패밀리를 위한 다중 토큰 예측(MTP) 드래프터를 출시했다. 이 드래프터는 추측적 디코딩(speculative decoding) 기술을 활용하여 최대 3배 빠른 추론 속도를 제공한다. 이는 인공지능 모델의 성능을 향상시키고, 사용자에게 더 나은 경험을 제공할 것으로 기대된다. 구글은 이러한 기술이 AI 인프라의 발전에 기여할 것이라고 강조했다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자