범죄자 의존도 측정으로 중개자 중요도 순위 매기기
초록
본 논문은 범죄 조사에서 특정 용의자와 연결된 중개자를 평가하기 위해 ‘신뢰 의존도’라는 새로운 측정 지표를 제안한다. 기존의 betweenness 중심성은 전체 네트워크에 대한 평균적인 중개자 역할만을 반영하지만, 제안된 방법은 선택된 용의자(source)와 모든 목적지(end) 사이의 최단 경로에 등장하는 중개자에 대한 의존도를 계산한다. Enron 이메일 데이터와 Noordin 테러리스트 네트워크에 적용한 결과, 기존 중앙성 지표와는 다른 인물들을 우선순위에 올릴 수 있음을 보였다.
상세 분석
논문은 먼저 기존의 betweenness 중심성 정의를 세 가지 관점(Freeman, Brandes, Geisberger)에서 정리하고, 이들 방법이 전체 네트워크의 모든 소스-타깃 쌍에 대해 평균적인 의존도를 산출한다는 한계를 지적한다. 특히 범죄 수사 상황에서는 조사 대상 용의자 하나 혹은 소수의 용의자에 대한 직접적인 연결망을 파악하는 것이 핵심이므로, 전체 네트워크에 대한 전역적인 중심성보다 ‘소스‑중개자‑목적지’ 삼중 관계에 초점을 맞춘 지표가 필요하다.
이를 위해 저자들은 두 단계의 수식을 제안한다. 첫 번째 단계는 Freeman의 pair‑dependency 개념을 차용해, 특정 소스 s와 목적지 t 사이의 최단 경로 중 중개자 v가 차지하는 비율을 Importance Rate IR(s,t)(v)=σ_st(v)/σ_st 로 정의한다. 두 번째 단계에서는 ‘신뢰(Trust)’라는 가중치를 도입한다. 신뢰는 소스 s와 중개자 v 사이의 거리 µ(s,v)를 전체 경로 길이 µ(s,t) 로 나눈 값 T(s,t)(v)=µ(s,v)/µ(s,t) 로 표현한다. 이때 거리 비율이 클수록, 즉 중개자가 소스로부터 멀리 있을수록 소스가 해당 중개자에게 더 큰 신뢰를 부여한다는 가정이다. 최종 의존도(Reliance)는 두 값을 곱해 R(s,t)(v)=IR(s,t)(v)·T(s,t)(v) 로 계산되며, 이를 모든 목적지 t에 대해 합산해 소스 s에 대한 중개자 v의 총 의존도를 얻는다.
수학적으로는 Brandes 알고리즘의 재귀적 의존도 전파 방식을 변형해, 특정 소스에 한정된 경로 집합만을 대상으로 효율적인 계산이 가능하도록 설계하였다. 또한 Geisberger의 길이 스케일링을 참고해 거리 비율을 명시적으로 포함함으로써, 대규모 네트워크에서도 과도한 중앙성 과대평가를 방지한다.
실험에서는 두 개의 실제 데이터셋을 사용했다. Enron 이메일 네트워크는 약 150,000개의 이메일 교환을 포함한 기업 내부 커뮤니케이션 그래프이며, 연구자는 재무 담당자 그룹을 ‘소스 집합’으로 설정했다. 의존도 순위 결과, 기존 betweenness나 PageRank에서는 눈에 띄지 않던 직원이 높은 의존도 점수를 받아, 실제로 해당 인물이 나중에 자금 세탁 혐의로 유죄 판결을 받은 사실과 일치한다. Noordin 테러리스트 네트워크에서는 테러리스트 조직 내 핵심 인물들을 소스로 지정했을 때, 의존도 측정이 기존 중앙성 지표와 크게 다른 순위를 도출했으며, 특히 조직 내 은밀히 연결된 지원자들을 효과적으로 드러냈다.
결과적으로, 제안된 의존도 측정은 (1) 특정 용의자와 직접적인 연관성을 가진 중개자를 정량화, (2) 거리 기반 신뢰 모델을 통해 장거리 중개자의 중요성을 강조, (3) 기존 중앙성 지표와 비교했을 때 범죄 수사에서 실제로 의미 있는 인물을 더 잘 식별한다는 장점을 가진다. 다만, 최단 경로에만 의존하기 때문에 네트워크가 다중 경로를 갖는 경우 정보 손실이 발생할 수 있으며, 거리 기반 신뢰 가정이 모든 범죄 유형에 동일하게 적용되는지는 추가 검증이 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기