지역 정보 프라이버시와 데이터 집계에의 적용

본 논문은 사전 지식을 활용해 개인 데이터를 로컬에서 보호하는 새로운 프라이버시 개념인 지역 정보 프라이버시(LIP)를 제안한다. LIP는 사전 분포와 잠재 변수와의 상관관계를 명시적으로 모델링함으로써 기존의 지역 차등 프라이버시(LDP)보다 낮은 노이즈로 높은 유틸리티를 달성한다. 최적화 프레임워크를 통해 평균제곱오차(MSE)를 최소화하는 RR, Unary Encoding, Local Hashing 기반 메커니즘을 설계하고, 가중합 및 히스토…

저자: Bo Jiang, Ming Li, Ravi T

본 연구는 사전 지식과 잠재 변수와의 상관관계를 명시적으로 활용하는 새로운 로컬 프라이버시 개념인 지역 정보 프라이버시(Local Information Privacy, LIP)를 제안한다. 기존의 로컬 차등 프라이버시(LDP)는 사전 정보를 전혀 고려하지 않는 컨텍스트 프리(context‑free) 접근법으로, 특히 데이터 도메인이 크거나 사전이 편향된 경우 과도한 노이즈를 삽입해야 하여 유틸리티가 크게 저하된다. LIP는 입력 X에 대한 사전 분포 θX와, 필요시 비밀 변수 G와의 결합 분포 θXG를 이용해 사후 확률과 사전 확률의 비율을 ε 이하로 제한함으로써, 사전이 높은 확률을 갖는 값은 적게 교란하고 낮은 확률을 갖는 값은 더 많이 교란하는 비대칭 메커니즘을 허용한다. 이는 정보 프라이버시(IP)의 로컬 버전으로, 사전이 정확히 알려졌을 때 LDP보다 넓은 파라미터 공간을 제공한다는 수학적 증명을 제시한다. 논문은 먼저 LIP 정의와 기존 프라이버시 개념(LDP, Pufferfish, Bayesian DP 등) 사이의 관계를 정리한다. LIP는 사전‑사후 비율을 직접 제한함으로써, 사전이 정확히 알려진 경우 가장 강력한 보장을 제공하고, 사전이 불확실한 경우에는 ‘bounded prior’ 집합을 도입해 최악의 사전에 대한 강건성을 확보한다. 다음으로, 데이터 집계 문제를 평균제곱오차(MSE) 최소화 관점에서 모델링한다. 시스템 모델은 N명의 사용자가 각자 사전 θX를 가지고 로컬 메커니즘 M을 통해 교란된 응답 Y를 서버에 전송하고, 서버는 Y를 이용해 함수 f(X)의 추정값 \(\hat{f}\)를 계산한다. 목표는 \(\mathbb{E}

지역 정보 프라이버시와 데이터 집계에의 적용

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기