대형 언어 모델 능력 향상을 위한 새로운 방법

발행일: 2025년 12월 18일 오후 1시 10분

MIT-IBM 왓슨 AI 연구소 연구진은 긴 텍스트에서 대형 언어 모델의 상태 추적과 연속적 추론을 개선하는 표현력 있는 아키텍처를 개발했습니다. 이 새로운 아키텍처는 LLMs의 성능을 향상시키는데 기여하며, 더 나은 문맥 파악과 유창한 대화를 가능하게 합니다. 이는 인공지능 및 기계학습 분야에 혁신을 가져올 것으로 기대됩니다.

#MIT슈바르츠만컴퓨팅대학 #MIT-IBM왓슨AI연구소 #공학학부 #기계학습 #데이터 #알고리즘 #연구 #인공지능 #전기공학및컴퓨터공학 #컴퓨터과학및인공지능연구소 #헤드라인

출처: MIT News

요약번역: 미주투데이 최은우 기자