이질적 소셜 네트워크에서 메시지 전파 유형 분류
초록
본 논문은 이질적(heterogeneous) 소셜 네트워크에서 메시지의 전파 양상을 분석하고, 전파 경로와 링크 유형을 활용한 베이시안 신념 함수 기반 분류기를 제안한다. 트위터 데이터를 이용해 실험을 수행했으며, 전파 단계가 증가할수록 증거 이론(evidence theory) 기반 분류기의 정확도가 향상되는 것을 확인하였다.
상세 분석
이 연구는 기존의 동질적(s homogeneous) 네트워크 분석이 갖는 한계를 지적하고, 실제 SNS가 사용자, 그룹, 애플리케이션 등 다양한 노드와 친구, 동료, 가족 등 여러 종류의 링크를 포함한다는 점을 강조한다. 이를 반영하기 위해 저자들은 이질적 네트워크 모델을 정의하고, 메시지 유형별(스팸, 전문, 가족) 전파 전략을 사전에 설정한다. 전파 전략은 각 링크 유형별로 메시지를 전달받는 비율을 지정하며, 노드마다 전파 경향성 파라미터를 부여해 메시지를 선택적으로 전파하도록 모델링한다.
전파 과정은 Algorithm 1에 명시된 대로, 지정된 반복 횟수(N) 동안 소스 노드에서 시작해 준비된 노드 집합을 순차적으로 활성화한다. 각 활성 노드는 자신의 아웃디그리와 전파 경향성, 그리고 현재 전략에 따라 각 링크 유형별로 전파할 이웃 수를 계산하고, 무작위 선택을 통해 실제 전파 대상 집합을 만든다. 이렇게 생성된 전파 네트워크(Propagation Network, PrNet)는 전파 레벨(소스와 목표 노드 사이의 홉 수)별로 노드·링크 통계가 축적된다.
학습 단계(Algorithm 2)에서는 다수의 PrNet 샘플을 이용해 레벨별 링크 유형별 도달 노드 수 N(TypeLink, Level)를 누적한다. 누적된 값은 레벨별 확률 분포로 정규화되고, 이를 베이시안 기본 신념 할당(BBA)으로 변환한다(consonant transformation). 이렇게 얻어진 확률 집합(ProbaSet)과 BBA 집합(BbaSet)은 각각 확률적 분류기와 증거 이론 기반 분류기의 학습 모델이 된다.
분류 단계(Algorithm 3)에서는 새로운 메시지의 전파 네트워크를 동일한 방식으로 파라미터를 추출한 뒤, 레벨별 확률 분포와 BBA를 사전에 학습된 각 전략의 분포와 거리 측정(Euclidean distance, Jousselme distance)한다. 최소 거리 전략을 선택함으로써 해당 레벨에서 메시지 유형을 결정한다.
실험은 NodeXL을 이용해 트위터에서 97명의 사용자와 350개의 팔로우 관계를 수집한 뒤, 무작위로 네 종류의 링크(전문, 가족, 친근, 정의되지 않음)를 부여해 이질적 네트워크를 구성하였다. 각 전략당 100개의 전파 네트워크를 학습 데이터로, 또 100개를 테스트 데이터로 사용했다. 결과는 전파 레벨이 증가할수록 증거 기반 분류기의 정확도(PCC)가 확연히 상승함을 보여준다. 특히 노이즈 비율이 20% 이상일 때, 3번째 레벨에서 증거 기반 분류기의 PCC가 확률 기반보다 우수했다. 이는 전파 과정에서 축적된 히스토리 정보가 베이시안 신념 함수에 의해 효과적으로 활용됨을 의미한다.
이 논문의 주요 기여는 (1) 이질적 소셜 네트워크를 고려한 전파 모델을 제시하고, (2) 전파 경로와 링크 유형을 정량화해 베이시안 신념 함수로 변환하는 파이프라인을 구축했으며, (3) 실증 실험을 통해 증거 이론 기반 분류기가 전통적인 확률 기반 방법보다 노이즈 환경에서 강인함을 입증했다는 점이다. 향후 연구에서는 링크 유형을 동적으로 학습하거나, 텍스트 내용과 결합한 다중 모달 분류기로 확장할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기