Anthropic 및 Thinking Machines Lab의 새로운 AI 연구, 모델 사양의 스트레스 테스트 및 언어 모델 간 캐릭터 차이 공개

AI 기업들은 훈련 및 평가 중에 목표 행동을 정의하기 위해 모델 사양을 사용합니다. 현재 사양은 목표 행동을 충분히 정확히 명시하고 있으며, 최신 모델은 동일한 사양 하에 서로 다른 행동 프로필을 나타내는지 알아보기 위해 Anthropic, Thinking Machines Lab 및 Constellation의 연구팀이 체계적인 방법을 제시했습니다. 이 연구는 모델 사양을 스트레스 테스트하고 언어 모델의 캐릭터 차이를 밝혔습니다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자