SNS 행동으로 빅파이브 성격 예측

SNS 행동으로 빅파이브 성격 예측
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 중국 대표 SNS인 Renren에서 수집한 209명의 사용자 행동 데이터를 기반으로 41개의 행동·감정 특성을 추출하고, 이를 이용해 빅파이브 성격 5요인을 3단계(저·중·고) 혹은 2단계(저·고) 분류하는 모델을 구축한다. C4.5 결정트리를 적용한 결과, 외향성·신경증 등 각 요인에서 평균 F1 점수가 0.70 이상이며, 이진 분류에서는 0.82~0.84까지 상승한다. 연구는 SNS 행동이 성격을 예측할 수 있음을 실증적으로 보여준다.

상세 분석

이 연구는 기존 심리학적 설문 기반 성격 측정의 한계를 보완하고자, 온라인 행동 로그를 자동으로 수집·라벨링하는 파이프라인을 설계했다. 데이터 수집 단계에서는 Renren API를 활용해 사용자의 기본 프로필, 친구·팔로워 수, 포스팅·블로그·사진 업로드 빈도 등 41개의 정량적 특성을 정의했으며, 특히 최근 한 달간의 상태·블로그 게시물에 대한 감정 분석(분노·재미·놀람·감동) 결과를 감정 관련 특성으로 포함했다. 감정 분류는 저자들이 사전 구축한 감정 사전과 Naïve Bayes 기반 텍스트 분류기를 결합해 80% 이상의 정확도를 달성하였다.

라벨링은 빅파이브 인벤토리(BFI) 설문을 통해 얻은 1~5점 연속형 점수를 평균±표준편차를 기준으로 저·중·고 3구간으로 이산화했으며, 추가 실험에서는 중간 구간을 제외한 이진 라벨링도 수행했다. 모델링에서는 Naïve Bayes, SVM, Decision Tree 등 여러 알고리즘을 비교했으며, C4.5 결정트리가 가장 높은 정밀도·재현율·F1을 기록했다. 10‑fold 교차검증 결과, 외향성(E)과 신경증(N)에서 각각 0.718, 0.713의 F1을 얻었고, 이진 분류에서는 외향성 0.839, 신경증 0.749까지 상승했다.

특히, 외향성은 ‘상태 재게시 비율’과 양의 상관관계를, 신경증은 ‘분노 블로그 비율’과 양의 상관관계를 보였으며, 이는 기존 연구와 일치한다. 그러나 전체적인 예측 정확도가 0.7 수준에 머무는 점은 행동 특성만으로는 성격의 복합성을 완전히 포착하기 어렵다는 한계를 시사한다. 또한 표본이 대학생 중심(평균 연령 23.8세)이고, Renren이라는 특정 SNS에 국한된 점은 결과의 일반화에 제약을 준다. 향후 연구에서는 다중 SNS 데이터를 통합하고, 딥러닝 기반 텍스트·이미지 감정 분석을 도입해 특성 표현력을 강화할 필요가 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기