삼각형 기반 사회 결속도 측정
초록
본 논문은 그래프에서 정점 집합의 “커뮤니티성”을 평가하기 위해 삼각형(3‑클리크) 개수를 이용한 새로운 지표 ‘cohesion’을 제안한다. 제안 지표는 내부 삼각형 비율과 외부 삼각형에 대한 격리 정도를 곱한 형태이며, 페이스북 사용자들을 대상으로 진행한 대규모 온라인 실험(Fellows)에서 사용자 주관적 만족도와 높은 상관관계를 보임으로써 실효성을 검증한다.
상세 분석
본 연구는 기존 커뮤니티 탐지 방법이 “분할 품질”에 초점을 맞추는 반면, 단일 정점 집합의 고유한 커뮤니티성을 독립적으로 평가하고자 하는 새로운 관점을 제시한다. 이를 위해 저자들은 세 가지 가정을 설정한다. 첫째, 특정 집합의 품질은 다른 커뮤니티의 존재와 무관해야 한다. 둘째, 원격에 위치한 정점은 해당 집합에 영향을 미치지 않아야 한다. 셋째, 커뮤니티는 내부가 외부보다 밀집되어 정보 흐름이 원활해야 한다. 이러한 가정 하에 ‘cohesion’은 다음과 같이 정의된다.
C(S) = (4_i(S) / (|S| choose 3)) × (4_i(S) / (4_i(S) + 4_o(S)))
여기서 4_i(S)는 집합 S 내부에 존재하는 삼각형 수, 4_o(S)는 정확히 두 정점이 S에 속하고 하나가 외부에 있는 ‘외부 삼각형’ 수이다. 첫 번째 인자는 전통적인 밀도 개념을 삼각형 수준으로 확장한 것이며, 두 번째 인자는 외부와의 연결을 약화시키는 역할을 한다. 즉, 외부 삼각형이 많을수록 격리도가 낮아져 전체 cohesion이 감소한다.
삼각형을 핵심 구조로 채택한 이유는 사회학에서 제시되는 ‘삼위 폐쇄(triadic closure)’와 ‘약한 연결(weak tie)’ 이론과 일치한다. 약한 연결은 보통 삼각형에 포함되지 않은 단일 엣지로 간주되며, 이러한 엣지는 커뮤니티 내부의 결속에 크게 기여하지 않는다. 따라서 cohesion은 강한 연결(삼각형)만을 고려함으로써 실제 사회적 결속을 더 정확히 반영한다.
수학적 기대값 분석에서도 무작위 그래프 G(n, p)에서는 C(S) ≈ p³·|S|/n 로, 큰 네트워크에서는 전체 그래프가 유일한 최적 커뮤니티가 됨을 보여준다. 이는 무작위 네트워크에서는 뚜렷한 커뮤니티 구조가 없다는 직관과 일치한다. 또한 ‘four‑groups’ 모델 실험을 통해 p_in이 증가하거나 p_out이 감소할 때 cohesion이 기대대로 상승함을 확인한다.
실험 부분에서는 페이스북 사용자 2,000여 명을 대상으로 ‘Fellows’ 애플리케이션을 제공, 사용자가 직접 자신의 친구 집합을 알고리즘으로 추출하고 1~5점 척도로 만족도를 평가하도록 했다. 추출된 집합마다 cohesion을 계산한 결과, 만족도와의 피어슨 상관계수가 0.71에 달해 강한 양의 상관관계를 보였다. 이는 사용자가 직관적으로 느끼는 “이 그룹이 내 커뮤니티인가?”라는 질문에 cohesion이 좋은 정량적 답을 제공한다는 실증적 증거가 된다.
마지막으로 저자들은 cohesion이 기존 모듈러리티 기반 방법과 달리 겹치는 커뮤니티 상황에서도 적용 가능하고, 외부 약한 연결을 자연스럽게 무시함으로써 실제 사회적 네트워크 분석에 적합한 지표임을 강조한다. 향후 연구에서는 가중치가 부여된 엣지, 동적 네트워크, 다중 관계 그래프 등에 cohesion을 확장하는 방안을 제시하고 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기