감정 인식을 위한 언어적 서명 활용
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 연구는 13개의 영어 감정 데이터셋에서 추출한 언어적 서명을 이용해 RoBERTa 기반 감정 분류 모델에 해석 가능한 특징을 추가함으로써, GoEmotions 벤치마크에서 매크로 F1 점수를 최대 2.4 포인트 향상시켰음을 보여준다.
상세 분석
본 논문은 감정 인식 분야에서 최근 Transformer 모델이 높은 성능을 보이고 있음에도 불구하고, 인간이 감정을 표현할 때 사용하는 언어적 규칙성을 충분히 활용하지 못하고 있다는 점을 지적한다. 이를 해결하기 위해 저자들은 SEANCE 도구와 General Inquirer(GI) 사전을 기반으로 13개의 공개 영어 감정 데이터셋(뉴스 헤드라인, 소셜 미디어, 대화 스크립트 등)에서 감정별 언어적 서명을 추출하였다. 서명 생성 과정은 각 감정 라벨별 텍스트를 모아 GI 카테고리 빈도값을 정규화하고, 전체 데이터셋에서 50% 이상 등장하는 특징만을 보존해 일관성을 확보한다. 결과적으로 ‘Active_GI’, ‘Iav_GI’, ‘Strong_GI’와 같은 일반적 특징과 ‘Virtue_GI’, ‘Hostile_GI’, ‘Need_GI’와 같은 감정 특이적 특징이 도출되었다.
다음으로 저자들은 두 가지 방식으로 이 서명을 Transformer에 통합했다. 첫 번째인 RoBERTa‑LexEnhance는 문장 수준에서
댓글 및 학술 토론
Loading comments...
의견 남기기