모든 전화 매체 활용 다차원 모바일 네트워크 분석
초록
본 논문은 대형 이동통신사의 12주간 통화와 SMS 기록을 이용해 수백만 사용자의 다중층(통화·문자) 모바일 소셜 네트워크를 구축하고, 단일층 네트워크와 비교하여 노드·링크 겹침 정도와 미디어 선택 행동을 정량적으로 분석한다.
상세 분석
이 연구는 기존에 통화 데이터만 혹은 문자 데이터만을 이용해 모바일 소셜 네트워크를 분석한 선행 연구와 달리, 두 가지 커뮤니케이션 채널을 동시에 고려한 ‘멀티플렉스’ 네트워크를 최초로 구축하였다. 데이터는 2012년 3월 26일부터 5월 31일까지 67일간 수집된 63백만 건의 통화 기록과 20백만 건의 SMS 기록이며, 동일 사업자 내 통화·문자만을 대상으로 하여 외부 연동에 의한 편향을 최소화하였다. 전처리 단계에서는 통화 지속시간이 1분 이상이고 상호작용 횟수가 3회 이상인 쌍, 문자 역시 3회 이상 교환된 쌍만을 남겨 사회적 의미가 있는 연결만을 추출하였다. 결과적으로 약 253,000명의 사용자를 포함하는 네트워크가 형성되었으며, 통화층(Gc)과 문자층(Gs) 각각의 정점·간선 수와 강한/약한 연결 성분을 비교하였다.
표 1에 따르면, 다층 네트워크(G)는 단일층에 비해 정점 수가 10% 정도 더 많고, 특히 강한 연결 성분에서 28% 이상의 연결쌍이 통화만으로는 포착되지 않음을 보여준다. 이는 문자 채널이 사회적 관계망을 보완한다는 강력한 증거이다. 노드 겹침 분석에서는 전체 사용자의 30%가 통화 전용, 8%가 문자 전용, 나머지 62%가 두 채널을 모두 이용한다는 사실이 드러났다. Jaccard 기반의 ‘층 Jaccard 거리 φ’를 도입해 각 사용자의 출·입 이웃 집합을 두 층에서 비교했으며, φ(+){c,s}와 φ(–){c,s} 분포는 약 40%의 사용자가 거의 전적으로 통화로만 관계를 유지하고, 약 30%는 두 채널을 동시에 활용한다는 점을 시각화한다.
또한, 다중층 그래프를 ‘에지 라벨이 있는 방향성 멀티그래프’로 정의하고, 차원(d)별 레이어 추출·합성 방법을 수학적으로 정형화하였다. 이론적 정의와 실제 데이터 적용을 통해, 동일한 사용자 쌍이 두 층에 모두 존재할 경우 하나의 ‘다중 연결’으로 취급함으로써 중복 계산을 방지하고, 각 층별 가중치를 별도로 분석할 수 있는 기반을 마련했다.
핵심 인사이트는 다음과 같다. 첫째, 단일 매체에 기반한 소셜 네트워크는 전체 사회구조의 약 20~30% 정도를 누락한다. 둘째, 사용자들은 개인의 사회적 역할·관계 강도에 따라 매체 선택이 다르게 나타나며, 특히 친밀도가 높은 관계는 통화로, 낮은 친밀도 혹은 비동기적 소통은 문자로 대체되는 경향이 있다. 셋째, 다층 네트워크 분석은 정보 확산, 전염병 모델링 등에서 매체별 전파 효율을 정량화하는 데 필수적이며, 향후 정책 설계나 마케팅 전략에 직접 활용될 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기