
앤트로픽, 클로드의 내부 활성화를 인간이 읽을 수 있는 텍스트로 변환하는 자연어 오토인코더 소개
앤트로픽이 클로드의 내부 활성화를 인간이 이해할 수 있는 텍스트로 변환하는 자연어 오토인코더를 발표했습니다. 이 기술은 모델의 ‘사고’ 과정을 더 쉽게 이해할 수 있도록 돕습니다.

앤트로픽이 클로드의 내부 활성화를 인간이 이해할 수 있는 텍스트로 변환하는 자연어 오토인코더를 발표했습니다. 이 기술은 모델의 ‘사고’ 과정을 더 쉽게 이해할 수 있도록 돕습니다.