최소극대 에이전트를 위한 보편 최적 개인정보 보호 메커니즘

초록

본 논문은 민감 데이터에 대한 집계 정보를 제공하면서 차별 없는 프라이버시 보장을 목표로 하는 차등 개인정보 보호 체계에서, 위험 회피형(최소극대) 정보 소비자를 모델링한다. 각 소비자는 쿼리와 관련된 사전 지식을 보유하고 손실 함수를 통해 오차 허용도를 정의한다. 이러한 합리적 행동 가정 하에, 고정된 카운트 쿼리에 대해 기하학적 메커니즘(Geometric Mechanism)이 모든 최소극대 소비자에게 보편적으로 최적임을 증명한다. 또한, 다중 프라이버시 레벨을 동시에 제공하면서도 협업 공격에 강인한 설계를 제시한다.

상세 요약

이 연구는 차등 개인정보 보호(differential privacy)의 전통적 정의를 그대로 유지하면서, 기존 연구에서 주로 채택된 베이즈형 효용 모델을 배제하고 의사결정 이론의 최소극대(minimax) 규칙을 적용한다는 점에서 독창적이다. 최소극대 에이전트는 “최악의 경우” 손실을 최소화하려는 위험 회피형 소비자로, 이는 실제 데이터 분석 환경에서 데이터 제공자가 사전 정보를 정확히 알 수 없을 때 보다 보수적인 설계 기준을 제공한다. 논문은 먼저 각 소비자가 가지고 있는 사전 지식(예: 쿼리 결과에 대한 구간 추정)과 손실 함수(예: 절대 오차, 제곱 오차 등)를 형식화한다. 손실 함수는 비음수이며, 오차가 클수록 급격히 증가하도록 가정한다.

그 다음, 메커니즘 설계 단계에서 고정된 카운트 쿼리(즉, 데이터베이스 내 특정 속성의 개수를 반환하는 쿼리)에 대해 기하학적 메커니즘을 정의한다. 이 메커니즘은 정수값에 대해 양쪽으로 기하급수적으로 감소하는 확률을 부여하는 노이즈 분포를 사용한다. 핵심 정리는 “모든 최소극대 소비자는 동일한 사후 손실을 최소화하기 위해 동일한 베이즈 사후 기대값을 사용한다”는 가정 하에, 기하학적 메커니즘이 어떤 다른 ε-차등 프라이버시 메커니즘보다 우월하다는 것이다. 증명은 라그랑주 이중성 및 선형 계획 이론을 활용해, 손실 함수의 볼록성 및 메커니즘의 확률 질량 함수가 만족해야 할 제약조건을 정량화한다.

특히, 다중 프라이버시 레벨을 동시에 제공하는 확장에서는 각 레벨에 대해 독립적인 기하학적 메커니즘을 적용하고, 결과를 계층적으로 공개한다. 이때, 서로 다른 레벨의 사용자가 협업하여 정보를 추출하려는 시도를 방지하기 위해, 메커니즘 간에 상호 보완적인 노이즈 구조를 설계한다. 결과적으로, 어떤 소비자 집단이든, 어느 레벨을 선택하든, 그리고 어떤 사전 지식을 가지고 있든, 제시된 메커니즘이 최소극대 기준에서 전역 최적임을 보인다.

이 논문의 기여는 세 가지로 요약할 수 있다. 첫째, 차등 프라이버시 환경에서 최소극대 효용 모델을 체계적으로 도입함으로써, 실용적인 위험 회피형 사용자를 위한 설계 기준을 제시한다. 둘째, 기하학적 메커니즘이 보편 최적임을 증명함으로써, 기존 베이즈 최적 메커니즘과는 별개의, 보다 강건한 최적성을 확보한다. 셋째, 다중 레벨 프라이버시 제공과 협업 저항성을 동시에 만족시키는 메커니즘 설계 방법을 제시한다. 이러한 결과는 데이터베이스 운영자와 정책 입안자가 다양한 사용자 요구와 보안 위협을 동시에 고려한 프라이버시 보호 전략을 수립하는 데 실질적인 지침을 제공한다.

초록

상세 요약

📜 논문 원문 (영문)