2026년 3월 7일 토요일
오늘의 신문
2026년 3월 7일 토요일 오늘의 신문
신경 기계 번역을 위한 최적 말뭉치 인식 훈련
발행일: 2025년 8월 15일 오전 12시 00분

신경 기계 번역(NMT)에서 말뭉치 인식 훈련(CAT)은 말뭉치 메타데이터를 효과적으로 활용하여 각 훈련 예제에 말뭉치 정보를 주입함으로써 훈련하는 방법이다. 이는 “태깅” 접근법으로 널리 알려져 있으며, CAT로 훈련된 모델은 데이터로부터 말뭉치 간의 품질, 도메인 및 뉴안스를 직접 학습하며 다른 추론 동작으로 쉽게 전환할 수 있다. CAT 모델은 평가를 위해 훈련 시작 전에 고품질 데이터 그룹을 미리 정의하며, 이는 오류가 발생하기 쉽고 비효율적일 수 있다. 이 연구에서는 최적 말뭉치 인식 훈련 방법을 제안한다.

<Apple 뉴스 본문 전체읽기>

출처: Apple
요약번역: 미주투데이 서현진 기자