문맥 강화 인용 감성 탐지

초록

본 논문은 인용문장의 감성을 긍정·부정·중립 세 가지로 분류하기 위해 여덟 개의 데이터셋을 구축하고, 인용문 주변 문맥을 포함한 경우와 제외한 경우를 비교한다. 워드 임베딩, 품사 태그, 의존 구문 정보를 결합한 앙상블 특징을 딥러닝 모델에 입력하여 성능을 평가했으며, 표본 수가 많을 때는 딥러닝이, 적을 때는 SVM이 우수함을 확인했다. 또한, 문맥을 활용한 샘플이 감성 분석 정확도를 크게 향상시켰다.

상세 요약

이 연구는 인용 감성 분석이라는 비교적 미개척 분야에 데이터와 방법론을 동시에 제공한다는 점에서 의미가 크다. 먼저 저자들은 인용문을 추출한 뒤, 각각을 긍정, 부정, 중립으로 라벨링한 8개의 데이터셋을 직접 구축하였다. 특히 3개의 데이터셋은 인용문 앞뒤의 문맥을 포함하도록 설계했으며, 이는 기존 연구가 인용문 자체만을 대상으로 했던 한계를 극복하려는 시도이다.

특징 추출 단계에서는 세 가지 정보를 결합한 ‘앙상블 피처’를 만든다. 첫째, 사전 훈련된 워드 임베딩(예: Word2Vec, FastText)을 사용해 각 토큰을 고차원 실수 벡터로 변환한다. 둘째, 품사(POS) 태그를 원-핫 인코딩하거나 임베딩 형태로 변환해 구문적 역할을 보강한다. 셋째, 의존 구문 트리를 기반으로 각 토큰 간의 관계(예: 주어‑동사, 목적어‑동사)를 그래프 형태로 인코딩한다. 이 세 가지 벡터를 연결(concatenation)하거나 가중 평균을 취해 최종 입력 피처를 만든다.

딥러닝 모델로는 주로 CNN과 BiLSTM을 조합한 하이브리드 구조를 사용했으며, 입력 피처의 차원을 줄이기 위해 배치 정규화와 드롭아웃을 적용했다. 반면, 전통적인 Bag‑of‑Words(BOW)와 TF‑IDF 기반의 선형 SVM 모델도 동일한 데이터에 대해 실험하였다. 결과는 표본 수가 1,000개 이상인 데이터셋에서는 딥러닝 모델이 F1‑score와 정확도 모두에서 SVM을 앞섰지만, 200~500개 수준의 소규모 데이터에서는 과적합 위험으로 SVM이 더 안정적인 성능을 보였다.

가장 주목할 점은 ‘문맥 포함’ 샘플이 ‘문맥 제외’ 샘플에 비해 평균 7~9%p 높은 정확도를 기록했다는 것이다. 이는 인용문 자체만으로는 저자의 의도나 평가를 완전히 파악하기 어려우며, 앞뒤 문장의 논리적 흐름이 감성 판단에 중요한 힌트를 제공한다는 가설을 실증적으로 뒷받침한다. 또한, 의존 구문 정보를 포함했을 때 특히 부정적인 인용을 식별하는 데 도움이 되었으며, 이는 부정적 인용이 종종 비판적 연결어(예: “하지만”, “그러나”)와 함께 나타나기 때문이다.

한계점으로는 데이터셋이 영어 논문에 국한되어 있어 다국어 적용 가능성을 검증하지 못했으며, 워드 임베딩을 사전 훈련된 모델에 의존함으로써 도메인 특화 용어에 대한 표현력이 떨어질 수 있다. 향후 연구에서는 멀티‑언어 BERT 기반 모델을 도입하고, 인용문과 전체 논문 구조를 동시에 고려하는 그래프 신경망(GNN) 접근법을 탐색할 여지가 있다.

초록

상세 요약

📜 논문 원문 (영문)