다중수준 네트워크 블록모델링 접근법 비교
본 논문은 조직‑개인 등 서로 다른 수준(level)으로 구성된 다중수준 네트워크를 분석하기 위한 세 가지 블록모델링 전략을 제시한다. (1) 각 수준을 별도로 블록모델링하고 결과를 비교하는 방법, (2) 다중수준 데이터를 하나의 수준으로 변환하여 기존 단일‑수준 블록모델링 기법을 적용하는 방법, (3) 모든 수준과 수준 간 연결을 동시에 고려하는 진정한 다중수준 블록모델링 방법이다. 각 접근법의 구현 절차와 장·단점을 논의하고, 실제 조직‑개…
저자: Aleš Žiberna
본 논문은 다중수준 네트워크(multilevel network)라는 복합 구조를 블록모델링 기법으로 분석하는 방법론을 체계적으로 제시한다. 다중수준 네트워크는 각각의 수준(level)마다 일변량(one‑mode) 네트워크와, 수준 간을 연결하는 이변량(two‑mode) 네트워크가 존재하는 형태로 정의된다. 예를 들어 조직‑개인, 학교‑학생, 부서‑직원 등 서로 다른 유형의 노드가 존재하고, 이들 사이에 소속·협업·연락 관계가 동시에 측정되는 경우가 해당한다.
논문은 먼저 다중수준 네트워크의 수학적 표기법을 정리한다. 전체 노드 집합 U는 L개의 부분집합 U₁,…,U_L 로 구분되며, 각 부분집합은 하나의 수준을 나타낸다. 관계 집합 R은 K개의 관계 R₁,…,R_K 로 구성되고, 각각은 일변량 혹은 이변량 행렬(또는 3‑way 배열) 형태로 표현된다. 특히 두‑모드 관계는 행렬 A_{12} 와 같이 수준 1 과 2 사이의 소속 정보를 담는다.
다음으로 일반화된 블록모델링(generalized blockmodeling)의 핵심 개념을 소개한다. 블록모델링은 네트워크를 군집(클러스터)과 군집 간 블록(패턴)으로 압축하고, 적합도 기준함수 P(C,E,N) 을 최소화하는 최적화 문제이다. 여기서 C 는 각 수준별 파티션, E 는 허용되는 블록 유형(예: 완전 연결, 빈 블록 등), N 은 관측 네트워크이다. 기존 연구는 주로 단일 관계와 단일 수준에 적용했으나, 본 논문은 이를 다중관계·다중수준으로 확장한다.
다중관계 블록모델링에서는 각 관계 R_k 마다 별도의 적합도 P_k 를 정의하고, 이를 가중합 ∑_k w_k P_k 형태로 하나의 목적함수로 통합한다. 가중치 w_k 는 연구자가 사전 지식이나 분석 목적에 따라 조정할 수 있다. 다중수준 군집 제약은 “같은 수준에 속하지 않은 노드는 같은 클러스터에 배치될 수 없다”는 제약식으로 수학화되며, 이는 가능한 파티션 집합 𝒫 을 제한한다. 이러한 제약은 탐색 공간을 크게 축소시켜 계산 효율성을 높인다.
논문은 세 가지 실용적인 접근법을 제시한다.
1. **별도 분석(Separate analysis)**
- 각 수준을 독립적으로 블록모델링한다(예: 개인 네트워크와 조직 네트워크 각각).
- 두‑모드 네트워크를 이용해 한 수준의 파티션을 다른 수준에 강제 적용한다. 구체적으로는 두‑모드 행렬 A_{12} 를 전·후곱하여 간접 연결 행렬을 만든 뒤, 기존 블록모델링 절차에 투입한다.
- 이 방법은 탐색 비용이 가장 낮고, 각 수준의 고유 구조를 먼저 파악하는 탐색적 단계로 적합하다.
2. **변환 접근법(Conversion approach)**
- 두‑모드 네트워크를 이용해 한 수준의 노드를 다른 수준의 “가상 노드”로 투영한다. 예를 들어 조직 수준의 네트워크를 개인 수준에 투영하면, 조직 간 연결이 개인 간 간접 연결로 변환된다.
- 변환된 단일‑수준 네트워크에 기존 일반화 블록모델링 알고리즘을 그대로 적용한다.
- 이 방법은 특정 수준에 집중하면서도 다른 수준의 정보를 보조 변수로 활용하고자 할 때 유용하다. 다만, 다중 소속(한 개인이 여러 조직에 속함) 등 복잡한 경우 평균·투표·가중치 등 추가적인 집계 규칙이 필요하다.
3. **진정한 다중수준 접근법(True multilevel approach)**
- 모든 일변량·이변량 관계를 동시에 고려하는 통합 최적화 문제를 설정한다. 파티션 변수 C₁,…,C_L 와 블록 유형 변수 E 를 동시에 최적화한다.
- 목적함수는 다중관계 가중합 형태이며, 제약식은 수준 간 군집 혼합 금지와 블록 유형 일치를 포함한다.
- 알고리즘은 로컬 탐색(예: 교환, 이동)과 메타휴리스틱(예: 시뮬레이티드 어닐링) 등을 결합해 전역 최적해에 근접한다.
- 계산 복잡도는 수준·관계·노드 수에 따라 급격히 증가하므로, 실제 적용 시 수준을 2~3개로 제한하거나 병렬 처리를 권장한다.
논문은 위 세 접근법을 실제 데이터에 적용해 비교한다. 사용된 데이터는 Lazega et al. (2006, 2008, 2013)의 법률 사무소 네트워크로, 변호사(개인)와 사무실(조직) 사이의 소속 관계와 변호사 간 협업 관계, 사무실 간 협업 관계가 포함된다.
- **별도 분석** 결과, 변호사 네트워크는 “핵‑주변” 구조, 사무실 네트워크는 “핵‑주변” 혹은 “계층” 구조가 도출되었다. 두 수준 간 파티션을 강제 적용했을 때, 일부 변호사 클러스터가 사무실 클러스터와 일치했으나, 전체적인 적합도는 낮았다.
- **변환 접근법**에서는 사무실 간 연결을 변호사 간 간접 연결로 변환한 뒤 블록모델링을 수행했다. 이때 변호사 클러스터링이 사무실 소속 정보를 반영해 더 일관된 블록(예: 같은 사무실에 속한 변호사들이 서로 강하게 연결)으로 개선되었다.
- **진정한 다중수준 모델**은 변호사와 사무실 모두를 동시에 최적화했으며, 두 수준 간 교차 블록(예: 특정 사무실에 속한 변호사 그룹이 다른 사무실에 속한 변호사 그룹과도 강하게 연결) 등을 식별했다. 이는 조직 구조와 업무 흐름을 동시에 설명하는 가장 풍부한 결과를 제공했다.
각 접근법의 장·단점을 정리하면 다음과 같다.
- **별도 분석**: 구현이 가장 간단하고 계산 비용이 낮다. 그러나 수준 간 상호작용을 충분히 반영하지 못한다.
- **변환 접근법**: 기존 단일‑수준 블록모델링 툴을 그대로 사용할 수 있어 실용적이며, 보조 수준의 정보를 효과적으로 활용한다. 다만 변환 과정에서 정보 손실(다중 소속, 가중치 선택) 위험이 있다.
- **진정한 다중수준 접근법**: 가장 풍부한 구조적 통찰을 제공하지만, 계산 복잡도와 파라미터 설정(가중치, 블록 유형)에서 높은 전문성이 요구된다.
결론적으로, 논문은 다중수준 네트워크 분석에 있어 블록모델링을 적용하는 체계적인 프레임워크를 제공한다. 연구자는 분석 목적·데이터 특성·계산 자원에 따라 세 접근법 중 적절한 방법을 선택할 수 있다. 특히 두‑모드 네트워크를 이용한 “재구성” 및 “투영” 절차는 기존 사회네트워크 분석 소프트웨어에 쉽게 통합될 수 있어, 실무 연구자들에게 즉시 활용 가능한 도구를 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기