DeepSeek R1T2 Chimera: R1-0528보다 200% 빠르며 개선된 추론과 간결한 출력

TNG 기술 컨설팅이 새로운 Assembly-of-Experts (AoE) 모델인 DeepSeek-TNG R1T2 Chimera를 선보였습니다. R1-0528, R1, V3-0324 세 가지 고성능 부모 모델로 구성된 R1T2는 전문가 계층 보간을 통해 대형 언어 모델(Large Language Models, LLMs)에서 새로운 효율성을 발휘합니다. 대규모 언어 모델에서 효율적인 모델 구성 기법을 보여주는 이 모델은 속도와 지능을 결합하여 혁신적인 모델 병합 전략을 통해 빠르게 발전하고 있습니다. 자세한 내용은 링크를 참고하세요.
#AIPaperSummary #Applications #ArtificialIntelligence #EditorsPick #LanguageModel #Machinelearning #NewReleases #OpenSource #TechNews #Technology
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자