MDM-Prime: 일반화된 마스크 디퓨전 모델(MDMs) 프레임워크, 샘플링 중 부분적으로 언마스크된 토큰 활성화

마스크 디퓨전 모델(MDMs)은 텍스트나 기호 시퀀스와 같은 이산 데이터를 생성하는 강력한 도구이다. 그러나 시간이 지남에 따라 점차 토큰을 언마스크하면서 발생하는 역과정에서 많은 단계가 시퀀스를 변경하지 않는 것이 관찰되었다. 이로 인해 MDM-Prime이라는 일반화된 MDMs 프레임워크가 소개되었다. MDM-Prime은 샘플링 중에 일부 토큰을 언마스크하면서 시퀀스 생성 효율을 향상시킨다. 이 프레임워크는 효율적으로 모델을 훈련시키고 새로운 데이터를 생성하는 데 도움이 된다.
출처: Mark Tech Post
요약번역: 미주투데이 김지호 기자