필리핀 상원의원 트위터 글 읽기 난이도와 감성 탐색
초록
본 연구는 2013‑2014년 기간 동안 6명의 필리핀 상원의원이 작성한 트위터 글을 대상으로 SMOG 지수를 활용한 가독성 평가와 Naïve Bayes 기반 감성 분석을 수행하였다. 평균 SMOG 점수는 8.6~9.2 수준으로, 초등학교 고학년에서 중학교 초반 수준의 독자가 이해할 수 있음을 보여준다. 감성 측면에서는 대부분 중립적이며, 특정 사회·정치 사건 발생 시 감성 변동이 관찰된다.
상세 분석
이 논문은 디지털 정치 커뮤니케이션 연구에서 드물게 가독성 측정 도구인 SMOG를 트위터와 같은 초단문에 적용한 점이 주목할 만하다. SMOG는 원래 30문장을 샘플링해 다중음절 단어 비율을 계산하도록 설계됐지만, 저자는 Child가 개발한 ‘짧은 텍스트용 SMOG’ 공식을 도입해 140자 이하의 트윗에 맞게 수정하였다. 결과적으로 6명의 상원의원 평균 SMOG 점수가 8.64~9.22 사이에 머물렀으며, 이는 필리핀 교육 체계(K‑12) 기준으로 초등학교 고학년에서 중학교 초반 수준에 해당한다. 즉, 일반 시민이 이해하기에 큰 장벽이 없다는 의미다.
감성 분석에서는 영어와 필리핀어(타갈로그어) 어휘를 혼합한 사전을 구축하고, Naïve Bayes 분류기를 적용해 각 트윗을 긍정, 부정, 중립으로 분류하였다. 분석 결과 대부분의 트윗이 ‘중립’으로 판정되었으며, 특정 시점(예: 주요 법안 통과, 국가적 사건)에서 감성 점수가 일시적으로 변동하는 패턴이 포착되었다. 이는 정치인들의 공식 커뮤니케이션이 사건 중심으로 감정 표현을 조절한다는 가설을 뒷받침한다.
하지만 방법론적 한계도 존재한다. 첫째, 샘플링 기간이 1년으로 제한돼 계절적·정치적 변동성을 충분히 포착하지 못한다. 둘째, 트윗이 영어와 타갈로그어가 혼용된 형태이므로 SMOG 점수가 실제 이해 난이도를 완전히 반영한다고 보기 어렵다. 다중음절 단어 비율만을 기준으로 하는 SMOG는 어휘 난이도는 잡아내지만, 문맥적 복잡성이나 문화적 배경을 고려하지 못한다. 셋째, 감성 사전이 제한적이며, 이모티콘·해시태그·링크 등 비텍스트 요소를 배제했기 때문에 실제 감성 흐름을 과소평가할 가능성이 있다. 마지막으로, 비교 대상이 다른 정치인이나 일반 시민의 트윗이 없으므로 ‘정치인 트윗이 평균보다 더 복잡하거나 중립적이다’라는 일반화를 하기엔 근거가 부족하다.
연구는 SMOG와 감성 분석을 결합해 정치인의 디지털 발언을 정량화하려는 시도로서 의미가 크다. 향후 연구에서는 더 넓은 시간 범위, 다양한 정치인 및 일반 사용자 데이터를 포함하고, Flesch‑Kincaid, Gunning Fog 등 다중 가독성 지표와 딥러닝 기반 감성 모델을 병행 적용해 결과의 신뢰성을 높일 필요가 있다. 또한, 언어 혼용 현상을 고려한 다중언어 SMOG 변형이나, 트윗의 멀티모달 특성을 반영한 분석 프레임워크를 구축한다면 정책 입안자와 커뮤니케이션 전문가에게 보다 실용적인 인사이트를 제공할 수 있을 것이다.
댓글 및 학술 토론
Loading comments...
의견 남기기