연속시간 확산 네트워크에서 다중 제품 영향력 최대화의 확장성과 효율성

본 논문은 연속시간 확산 모델 하에서 다중 제품을 동시에 홍보하기 위한 영향력 최대화 문제를, 사용자 주의 제한·예산·시간 제약을 동시에 고려한 서브모듈러 최적화로 정의한다. 제안된 랜덤화된 영향력 추정 알고리즘은 ε 정확도를 위해 O(1/ε²) 번의 샘플링만으로 |E|·O(1/ε²)+|V|·O(1/ε²) 의 연산량을 요구한다. 이를 기반으로 설계한 적응형 임계값 그리디 알고리즘은 k개의 배낭 제약 중 ka개가 활성화된 경우 최적값의 ka/(2…

저자: Nan Du, Yingyu Liang, Maria-Florina Balcan

연속시간 확산 네트워크에서 다중 제품 영향력 최대화의 확장성과 효율성
소셜 네트워크를 활용한 바이럴 마케팅은 전통적으로 단일 제품을 대상으로 무제한 예산·시간·사용자 주의라는 이상적인 가정 하에 영향력 최대화 문제를 정의해 왔다. 그러나 실제 광고 플랫폼에서는 여러 제품이 동시에 홍보되어야 하고, 각 제품마다 전파 속도와 목표 시장이 다르며, 사용자는 제한된 수의 광고만을 수용한다. 또한 광고주는 각 제품에 할당할 수 있는 예산이 제한적이며, 캠페인 효과는 일정 시간 내에 측정되어야 한다. 이러한 현실적 제약을 모두 반영하기 위해 저자들은 (1) 연속시간 확산 모델, (2) 다중 제품별 전파 네트워크, (3) 사용자·제품·예산·시간 제약을 동시에 고려한 수학적 모델을 제시한다. 연속시간 확산 모델은 각 엣지에 전이 시간의 확률밀도 함수를 부여한다. 전이 함수는 지수, 레일리 등 파라메트릭 형태뿐 아니라 비파라메트릭 형태도 허용한다. 독립적 전이 시간 τij 를 샘플링하면, 전체 전파 과정은 소스 집합 A 로부터 각 노드 i 에 대한 최단경로 길이 ti = min_{path} Σ τ 에 의해 결정된다. 이 특성을 이용해 노드 i 가 시간 T 내에 감염될 확률 Pr{ti ≤ T | A} 를 직접 추정할 수 있다. 첫 번째 핵심 기여는 이 확률을 ε 정확도로 추정하는 랜덤화 알고리즘이다. 전이 시간 샘플을 n = O(1/ε²) 번 생성하고, 각 샘플에 대해 Dijkstra‑like 알고리즘으로 최단경로를 계산한다. 전체 복잡도는 \tilde{O}(n|E| + n|V|) 로, 대규모 네트워크에서도 메모리와 시간 효율성을 유지한다. 실험에서는 기존 Monte‑Carlo 기반 추정기 대비 평균 오차가 30% 이상 감소했으며, 실행 시간은 5배 이상 빨라졌다. 두 번째 핵심 기여는 추정된 영향력 함수를 서브모듈러 목표함수로 보고, matroid와 다중 배낭 제약의 교집합 위에서 최적화하는 알고리즘이다. 사용자 주의 제한은 각 사용자가 선택될 수 있는 광고 수를 제한하는 matroid 제약으로 모델링한다. 제품별 비용·예산은 배낭 제약으로 표현된다. 전체 제약은 하나의 matroid과 k개의 배낭 제약의 교집합이 된다. 저자들은 기존의 (1‑1/e) 근사 그리디와 달리, 현재 활성화된 배낭 제약 개수 ka 에 따라 임계값을 동적으로 조정하는 adaptive‑threshold greedy 를 설계했다. 알고리즘은 각 후보 노드의 marginal gain / 비용 비율을 계산하고, 현재 임계값보다 큰 경우에만 선택한다. 선택 과정은 O(k·|V|) 로 선형이며, 이론적으로 선택된 집합의 목표값이 최적값의 ka/(2+2k) 배 이상임을 증명한다. 특히 모든 제품 비용이 동일하면 제약이 matroid만 남아 1/3 근사를 달성하고, 이는 matroid‑intersection 최적화의 알려진 하한과 일치한다. 실험에서는 합성 그래프와 실제 소셜 네트워크(예: Twitter, LiveJournal) 두 종류를 사용하였다. 영향력 추정 단계에서는 기존의 Monte‑Carlo 기반 추정기 대비 평균 절대 오차가 30% 이상 감소했으며, 실행 시간은 5배 이상 빠르게 측정되었다. 최적화 단계에서는 제안된 그리디가 동일한 예산·시간 제약 하에서 전통적인 CELF‑based 혹은 스위치‑점프 기법보다 10~15% 높은 실제 전파량을 달성했다. 특히 배낭 제약이 여러 개일 때도 근사 비율이 이론적 한계에 근접함을 보였다. 전체 파이프라인은 메모리 사용량이 O(|V|+|E|) 로 제한돼, 10M 노드·100M 엣지 규모의 데이터셋에서도 64GB RAM을 갖춘 단일 머신에서 2시간 이내에 결과를 도출했다. 결론적으로, 이 연구는 (1) 연속시간 그래픽 모델 기반의 정확하고 확장 가능한 영향력 추정 기법, (2) 다중 제약을 동시에 다루는 적응형 그리디 최적화 알고리즘, (3) 실험적으로 입증된 높은 효율성과 정확도라는 세 축을 모두 만족한다는 점에서, 실무적인 바이럴 마케팅 및 광고 배분 시스템에 바로 적용 가능한 중요한 진전을 제공한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기