연속형 응답을 위한 라벨 차등 프라이버시 회귀 기법 RPWithPrior
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 기존의 라벨 차등 프라이버시(ε‑label DP) 회귀 방법이 이산화와 정수 반올림에 의존하는 한계를 극복하고, 원본 및 난수화된 응답을 연속 확률 변수로 모델링한다. 최적 구간을 추정하고 사전 분포가 알려졌을 때와 알려지지 않았을 때 각각에 맞는 RPWithPrior 알고리즘을 제시하며, ε‑label DP를 만족함을 증명한다. 실험 결과, 기존 Gaussian, Laplace, Staircase, RR‑on‑Bins, Unbiased 메커니즘 대비 MSE와 실행 시간에서 우수함을 확인한다.
상세 분석
이 논문은 라벨 차등 프라이버시(LDP) 하에서 회귀 문제를 해결하기 위한 근본적인 패러다임 전환을 제안한다. 기존 연구(GKK+22, BGK+23)는 연속형 레이블을 강제로 이산화하고, 정수값으로 반올림한 뒤 동적 프로그래밍을 통해 최적 bin을 찾는 방식으로, 저장·연산 비용이 크게 증가하고 실제 연속형 데이터와의 불일치가 발생한다. 저자들은 이러한 이산화 과정을 완전히 배제하고, 원본 레이블 Y와 난수화된 레이블 ˜Y를 연속 확률 변수로 간주한다.
핵심 아이디어는 “최적 구간 I =
댓글 및 학술 토론
Loading comments...
의견 남기기