2026년 3월 8일 일요일
오늘의 신문
2026년 3월 8일 일요일 오늘의 신문
대형 언어 모델의 슈퍼 가중치
발행일: 2025년 7월 2일 오전 12시 00분

최근 연구에서 대형 언어 모델(LLM)의 일부 파라미터가 모델의 품질에 더 큰 영향을 미친다는 놀라운 결과가 나왔다. LLM에는 수십억 개의 파라미터가 포함되어 있기 때문에, 0.01%와 같은 작은 분수도 수십만 개의 파라미터로 변환된다. 본 연구에서는 더 놀라운 결과를 제시하는데, 단 하나의 파라미터를 제거하는 것만으로도 LLM의 텍스트 생성 능력을 파괴할 수 있음을 발견했다. perplexity를 3차원으로 증가시키고 zero-shot 정확도를 추측 수준으로 낮출 수 있다. 이러한 파라미터를 식별하기 위한 데이터 없는 방법을 제안한다.

<Apple 뉴스 본문 전체읽기>

출처: Apple
요약번역: 미주투데이 서현진 기자