온라인 소셜 네트워크 상 상호작용 파라미터 탐색적 분석
초록
본 연구는 3,200명 이상의 페이스북 사용자와 1,400,000여 개의 친구 관계에서 13가지 상호작용 지표를 수집·분석한다. 각 지표의 분포를 감마 혹은 로그정규 모델로 근사하고, 피어슨 상관계수를 통해 파라미터 간 연관성을 파악하였다. 결과는 대부분의 친구 관계가 거의 상호작용이 없으며, 상호작용 강도와 공통 친구 수 사이에 뚜렷한 상관관계가 없음을 보여준다.
상세 분석
이 논문은 페이스북 API를 활용한 대규모 사회실험 ‘NajFrend’를 기반으로, 사용자‑친구 쌍 1,400,000건에 대해 13개의 상호작용 파라미터(공통 친구 수, 피드 좋아요·댓글·게시물, 공동 사진 태그, 사진·링크 좋아요·댓글, 인박스 채팅 등)를 수집하였다. 데이터는 0값이 다수 차지하는 희소성을 보였으며, 이를 고려해 비제로 값에 대한 최적 이론분포를 탐색하였다. 후보 분포로는 베타, 감마, 역감마, 정규, 로그정규, 왜도 정규, 기하, 균등 등을 검토했으며, 최대우도추정(MLE)과 χ² 검정을 통해 감마 분포가 대부분의 파라미터에 가장 적합함을 확인했다. 단, ‘inbox_chat’ 파라미터는 로그정규가 최적이었다. 각 파라미터별 0값 비율은 3%에서 97%까지 다양했으며, 특히 ‘feed_together_in_post’와 ‘mutual_photo_published_by_friend’ 등은 97% 이상이 0이었다.
상관관계 분석에서는 피어슨 상관계수를 행렬 형태로 제시했으며, 가장 높은 상관은 ‘feed_comment’와 ‘feed_addressed’(독립적인 게시물 작성) 사이였고, ‘photo_like’와 ‘feed_like’, ‘photo_comment’와 ‘feed_comment’ 사이에도 강한 양의 상관이 나타났다. 반면, 서로 다른 사진 공유 방식(사용자·친구·제3자 업로드) 간 상관은 낮았으며, ‘friend_mutual’(공통 친구 수)와 다른 모든 상호작용 파라미터 간에도 유의미한 상관이 없었다. 이는 온라인 상의 연결 강도와 실제 상호작용 빈도가 반드시 일치하지 않음을 시사한다.
연구는 또한 듄바르 수(Dunbar’s number)와 비교해 평균 페이스북 친구 수(429명) 대비 실제 활발히 교류하는 관계가 극히 적다는 점을 강조한다. 이러한 결과는 강한 관계를 식별하기 위한 모델링에 있어 0값 비율을 적절히 처리하고, 감마·로그정규와 같은 비대칭 분포를 활용하는 것이 필요함을 보여준다. 한계점으로는 데이터가 2015년 기준의 페이스북 환경에 국한되고, 문화·지역적 편향(주로 크로아티아 및 인접 국가) 가능성이 있다. 향후 연구에서는 이러한 편향을 보완하고, 탐색적 결과를 기반으로 실제 관계 강도를 추정하는 지도학습 모델을 개발하는 것이 제안된다.
댓글 및 학술 토론
Loading comments...
의견 남기기