대규모 소셜 네트워크를 위한 빠르고 안정적인 영향력 최대화 알고리즘 IRIE
초록
본 논문은 독립 전파(Independent Cascade, IC) 모델과 부정 의견 전파를 포함한 IC‑N 모델을 대상으로, 메시지 전달 기반의 영향력 순위(IR)와 영향력 추정(IE)을 결합한 새로운 알고리즘 IRIE를 제안한다. IRIE는 선형 방정식 시스템을 반복적으로 풀어 전역적인 영향력 순위를 빠르게 산출하고, 선택된 시드의 영향을 IE 단계에서 즉시 반영해 다음 라운드의 순위를 조정한다. 실험 결과, IRIE는 기존 최고 성능 휴리스틱인 PMIA보다 10~100배 빠르게 동작하며 메모리 사용량도 크게 절감한다. 또한 네트워크 밀도·크기·전파 규모에 대해 뛰어난 안정성을 보인다.
상세 분석
IRIE 알고리즘은 두 핵심 모듈인 Influence Ranking(IR)과 Influence Estimation(IE)으로 구성된다. IR 단계에서는 각 노드 u의 기대 활성화 수 σ(u)를 트리 구조에 대한 정확한 해로부터 일반 그래프에 적용 가능한 근사식으로 전개한다. 구체적으로, 인접 노드 v에 대한 메시지 m(u,v)는 “u가 v 방향을 제외하고 전파했을 때 기대 활성화 수”로 정의되고, 다음 식을 만족한다. ˜σ(u)=1+∑{v∈N_out(u)}P_uv·˜m(v,u) (1) ˜m(u,v)=1+∑{w∈N_out(u), w≠v}P_uw·˜m(w,u) (2) 식 (2)는 |E|개의 선형 방정식으로 이루어진 시스템이며, Belief Propagation과 유사한 메시지 전달 방식으로 반복적으로 업데이트한다. 알고리즘 2에서는 초기값을 1로 두고, 감쇠 계수 α(0<α≤1)를 곱해 수렴성을 높인다. 반복 종료 조건은 모든 메시지가 변동이 없을 때이며, 실제 실험에서는 5~10번의 반복만으로 충분히 수렴한다.
IR 단계만으로는 단일 시드 선택에만 적합하고, 다중 시드 집합을 구성하면 서로의 영향 영역이 중복돼 최적 해와 차이가 난다. 이를 보완하기 위해 IE 단계가 도입된다. 현재까지 선택된 시드 집합 S에 대해, 각 노드 v에 대한 추가 영향 Δ(v)=∑_{u∈S}˜m(u,v)·P_uv 를 빠르게 계산한다. 이 값은 Monte‑Carlo 시뮬레이션 없이도 marginal influence σ(v|S)를 근사한다. 이후 IR 단계에서 사용되는 입력 파라미터를 Δ(v)만큼 감소시켜, 이미 활성화된 영역을 반영한 새로운 순위를 얻는다. 이렇게 IR과 IE를 교대로 수행함으로써, 매 라운드마다 전체 후보 노드에 대한 정확한 marginal influence를 추정하지 않아도 된다.
시간 복잡도 측면에서, IR 단계는 메시지 전파에 O(|E|·T) (T는 반복 횟수)이며, IE 단계는 O(|E|) 수준이다. 반면 PMIA는 각 노드마다 지역 트리를 구축하고, Greedy‑MC는 수천 번의 시뮬레이션을 수행해야 하므로 O(k·|E|·log|V|) 혹은 그 이상이 된다. 메모리 사용량도 IRIE는 메시지 값만 저장하면 되므로 O(|E|)이며, PMIA는 각 노드별 지역 트리와 후보 리스트를 저장해 O(|V|·d) (d는 평균 깊이) 정도가 필요하다.
실험에서는 합성 그래프와 5개의 실제 소셜 네트워크(Facebook, Twitter, LiveJournal 등)에서 k=50500까지 다양한 설정을 테스트했다. 영향력 커버리지는 Greedy와 거의 동일하거나 약간 앞섰으며, PMIA 대비 10배100배 빠른 실행 시간을 기록했다. 특히 네트워크 클러스터링 계수가 높거나 평균 차수가 큰 경우에도 실행 시간이 크게 변동하지 않아, 알고리즘의 안정성이 입증되었다. IC‑N 모델에 대해서도 MIA‑N 대비 비슷한 커버리지를 유지하면서 5배 이상 빠른 성능을 보였다.
요약하면, IRIE는 선형 방정식 기반의 전역 순위 계산과 간단한 영향 추정을 결합해, 기존 휴리스틱보다 훨씬 빠르고 메모리 효율적이며, 다양한 네트워크 특성에 대해 견고한 성능을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기