데이터 공유와 차등 프라이버시: 자율적 선택이 만든 협동과 효율성
초록
본 논문은 개별 데이터 보유자들이 차등 프라이버시(ε) 수준을 스스로 선택하면서 형성되는 데이터 공유 연합의 안정성, 효율성, 그리고 사회 최적과의 격차를 분석한다. 참여 여부와 프라이버시 수준을 동시에 결정하는 게임을 모델링하고, Nash 균형과 ‘강건 균형(robust equilibrium)’을 정의·특성화한다. 다양한 프라이버시 비용 구조(감소형·증가형)를 고려해 균형 존재 여부, 연합 규모·구성, 그리고 사회 복지·추정 정확도에 미치는 영향을 정량화한다. 마지막으로 중앙집중식 설계와 비교해 ‘안정성 비용(Price of Stability)’을 제시한다.
상세 분석
논문은 먼저 차등 프라이버시가 데이터 공유에 미치는 외부효과를 명시한다. 각 에이전트 i는 자신의 데이터 x_i와 프라이버시 비용 함수 c_i(ε_i,|S|)를 가지고, 연합 S에 참여할지와 ε_i(=노이즈 수준)를 선택한다. ε_i가 작을수록 개인의 프라이버시 손실이 커지고, 반대로 큰 ε_i는 연합 전체의 추정 분산을 크게 만든다. 저자는 이중 외부효과(프라이버시·정확도)를 포함한 비협조 게임을 정의하고, 두 가지 안정성 개념을 제시한다.
-
Nash 균형: 모든 에이전트가 자신의 참여·ε 선택을 일방적으로 바꿀 수 없을 때. 저자는 비용 함수가 감소형(예: 데이터 풀링에 의한 프라이버시 증폭)일 때는 균형이 존재하지만, 비용이 증가형(예: 규모가 커질수록 공격 표면이 확대)일 때는 균형이 존재하지 않을 수도 있음을 증명한다. 또한, 파라미터(에이전트 수 n, 비용 곡선 형태)에 따라 연합 규모가 비단조적으로 변할 수 있음을 보여준다.
-
강건 균형(Robust equilibrium): 기존 연합 구성원이 외부 에이전트의 진입을 거부할 수 있는 권한을 부여한다. 이 정의는 균형 존재성을 크게 확대한다. 저자는 모든 비용 프로파일에 대해 강건 균형이 존재함을 보이고, 연합의 최대 규모가 비용 함수의 임계점에 의해 결정된다는 구조적 특성을 도출한다.
다음으로 사회 최적을 중앙집중식 설계자가 결정한다. 설계자는 전체 사회 복지 W(S,ε)=∑_i v_i -∑_i c_i(ε,|S|)와 추정 분산을 동시에 최소화한다. 저자는 비용이 감소형일 때는 전체 참여가 최적이 되지만, 비용이 급격히 증가하면 부분 참여 혹은 불참이 최적이 된다.
효율성 분석에서는 두 균형 개념에 대해 Price of Stability (PoS)를 정의한다. PoS는 사회 복지와 추정 분산 측면에서 중앙집중식 최적 대비 얼마나 손실이 나는지를 나타낸다. 결과적으로, 비용이 완만하게 증가하거나 감소하는 구간에서는 PoS가 상수 수준에 머물지만, 급격한 비용 상승 구간에서는 PoS가 Θ(n)까지 확대될 수 있음을 보인다. 이는 프라이버시 비용의 스케일링이 분산 감소 효과보다 크게 작용할 때, 탈중앙화된 연합이 비효율적으로 작동한다는 중요한 시사점을 제공한다.
기술적 기여는 (i) 프라이버시·정확도 외부효과를 포함한 새로운 협동 게임 모델, (ii) 균형 존재성 및 구조에 대한 정량적 정리, (iii) 비용 프로파일에 따른 효율성 경계 도출이다. 특히, 강건 균형을 도입해 현실적인 ‘진입 차단’ 메커니즘을 모델링한 점이 혁신적이며, 데이터 연합 설계 시 정책 입안자에게 프라이버시 비용 구조를 어떻게 설계해야 하는지에 대한 실질적 가이드를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기