2026년 4월 23일 목요일
오늘의 신문
2026년 4월 23일 목요일 오늘의 신문
ProText: 긴 글에서 성별 표현 측정을 위한 벤치마크 데이터셋
발행일: 2026년 3월 31일 오전 12시 00분

ProText는 긴 영어 텍스트에서 성별 표현과 잘못된 성별 표현을 측정하기 위한 데이터셋으로 소개됩니다. 이 데이터셋은 세 가지 주요 차원으로 구성되어 있습니다. 첫 번째는 주제 명사로, 이름, 직업, 직함, 친족 용어 등이 포함됩니다. 두 번째는 주제 범주로, 전형적으로 남성적, 전형적으로 여성적, 성 중립적/비성별적 범주가 있습니다. 마지막으로 대명사 범주로는 남성, 여성, 성 중립, 없음이 포함됩니다. ProText는 최신 대형 언어 모델을 활용하여 요약 및 재작성과 같은 텍스트 변환에서 성별 표현을 탐구하도록 설계되었습니다. 이는 전통적인 대명사 해결 벤치마크를 넘어서는 연구입니다.

<Apple 뉴스 본문 전체읽기>

출처: Apple
요약번역: 미주투데이 서현진 기자