누락된 데이터가 만든 프라이버시 증폭

누락된 데이터가 만든 프라이버시 증폭
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 결측값이 존재하는 데이터셋을 차별적 프라이버시( DP) 메커니즘에 적용했을 때, 결측 메커니즘 자체가 프라이버시 증폭 효과를 제공한다는 이론적 근거를 제시한다. MCAR·MAR 조건 하에 결측 확률 p*와 관측 비율 ρ에 따라 기존 DP 알고리즘의 ε·δ 파라미터가 감소함을 보이며, 특히 특성별 Lipschitz( FWL) 쿼리에 대해 라플라스·가우시안 메커니즘의 증폭량을 정량화한다.

상세 분석

논문은 먼저 결측 데이터 메커니즘을 확률적 마스크 F와 그 독립적 복제 D=F⊗n 으로 정의하고, 이를 차별적 프라이버시 알고리즘 A와의 합성 A_D 로 모델링한다. 이때 A는 기존에 (ε,δ)-DP를 만족하는 임의의 무작위 알고리즘이며, A_D는 마스크가 적용된 불완전 데이터에 대해 동일한 알고리즘을 실행한다. 핵심 정리는 MAR(또는 MCAR) 조건 하에 존재하는 상수 p*∈


댓글 및 학술 토론

Loading comments...

의견 남기기