조각별 혼합 분포를 활용한 보다 유연한 차등 개인정보 보호
초록
본 논문은 기존 라플라스·기하학적 메커니즘을 두 개의 구간으로 결합한 “조각별 혼합 분포”를 제안한다. ε, r, c 세 파라미터를 통해 프라이버시 손실과 노이즈 규모를 세밀히 조절함으로써, 동일한 프라이버시 보장 하에 기존 방법보다 낮은 분산·절대오차를 달성한다. 이론적 프라이버시 증명과 엔트로피·분산·기대값의 폐쇄형 식을 제시하고, 정수 카운트·히스토그램 쿼리에 대한 실험에서 전통 라플라스·기하학적 메커니즘 대비 전반적인 유틸리티가 향상됨을 확인한다.
상세 분석
본 연구는 차등 개인정보 보호(DP)의 실용적 한계, 즉 “유틸리티 감소와 파라미터의 경직성”을 극복하기 위해 두 개의 라플라스 혹은 대칭 기하학적(Discrete Laplace) 분포를 하나의 파라미터 c를 기준으로 결합한 조각별 혼합 분포(Piecewise Mixture Distribution)를 도입한다. 이때 각각의 구간에 적용되는 스케일 파라미터는 b₁=Δf/(r·ε)와 b₂=Δf/ε 로 정의되며, r>0은 외부 구간( |x|>c )에서 노이즈를 더 얇게 만들어 정확도를 높이는 역할을 한다. c는 중심 구간( |x|≤c )을 결정하는 절단점으로, 이 구간에서는 기존 라플라스와 동일한 스케일 b₂를 사용해 프라이버시 손실을 제한한다.
핵심 이론적 기여는 다음과 같다. 첫째, 혼합 PDF와 CDF를 연속적으로 정의하기 위해 상수 a₁, a₂와 가중치 p₁, p₂를 도출하고, 이를 통해 전체 분포가 정상화됨을 증명한다. 둘째, 이 분포에서의 엔트로피, 분산, 절대값 기대값을 각각 폐쇄형 식으로 구해, r과 c가 증가할수록 엔트로피는 감소하지만 분산과 절대오차는 크게 감소함을 수식적으로 보여준다. 셋째, 프라이버시 손실 Lₓ = ln( Pr
댓글 및 학술 토론
Loading comments...
의견 남기기