UCSD와 Together AI, 파르카에(Parcae) 발표: 두 배 크기의 트랜스포머 품질을 달성하는 안정적인 루프 언어 모델 아키텍처

UCSD와 Together AI 연구팀이 새로운 언어 모델 아키텍처인 파르카에(Parcae)를 발표했습니다. 이 모델은 기존의 트랜스포머 모델보다 두 배 크기의 품질을 달성하면서도 안정성을 유지하는 것이 특징입니다. 언어 모델의 품질을 높이기 위해서는 더 많은 FLOPs와 파라미터, 그리고 더 많은 토큰으로 훈련하는 것이 일반적이지만, 최근 연구자들은 이러한 접근 방식이 아닌 새로운 방법을 모색하고 있습니다. 특히, 모델 배포가 점점 더 많은 컴퓨팅 자원을 소모하고, 엣지 컴퓨팅으로의 전환이 이루어짐에 따라, 품질을 유지하면서도 효율성을 높이는 것이 중요한 과제로 떠오르고 있습니다. 파르카에는 이러한 요구에 부응하기 위해 설계된 모델로, 향후 다양한 AI 응용 프로그램에서 활용될 것으로 기대됩니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자