기존의 한국어 혐오 표현 탐지 데이터셋은 혐오의 분류(혐오, 불쾌, 일반)와 종류(성별, 기타)만이 레이블링되어 있음. 본 과제에서는 혐오 표현의 다양한 종류(성별, 성적 취향, 인종, 국적, 인종, 종교)와 혐오의 근거 부분을 포함하여 데이터셋을 구축. 모델이 예측한 근거 부분으로 예측 결과가 설명 가능
[원문보기]