차등 프라이버시와 ORAM을 결합한 효율적인 외부 데이터베이스 쿼리

차등 프라이버시와 ORAM을 결합한 효율적인 외부 데이터베이스 쿼리
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 외부 서버에 데이터를 위임하면서도 접근 패턴과 통신량 누수를 차등 프라이버시(DP)와 Oblivious RAM(ORAM)으로 완전히 차단하는 시스템 𝔈psolute을 제안한다. 레코드 수준의 DP를 보장하면서도 범위·점 쿼리를 실용적인 속도로 처리하도록 병렬화와 노이즈 최소화 기법을 도입하였다. 실험 결과 10 백만 레코드 규모에서도 MySQL·PostgreSQL 대비 4~8배 정도의 오버헤드만 발생함을 보였다.

상세 분석

𝔈psolute은 기존 외부 데이터베이스 시스템이 직면한 두 가지 주요 정보 누출, 즉 접근 패턴(AP)과 결과 집합 크기(통신량, CV)를 동시에 차단한다는 점에서 혁신적이다. 먼저, 모든 데이터와 인덱스를 ORAM에 저장함으로써 서버는 어떤 레코드가 실제로 접근되었는지 알 수 없게 만든다. ORAM 자체는 접근 순서를 무작위화하고, 읽기·쓰기 연산을 동일한 비용으로 수행하도록 설계되어 있다. 그러나 ORAM만으로는 결과 집합 크기 자체가 노출되는 문제를 해결하지 못한다. 이를 보완하기 위해 𝔈psolute은 차등 프라이버시 기반의 ‘sanitizer’를 도입한다. 구체적으로, 범위 쿼리 시 실제 반환해야 할 레코드 수에 라플라스 노이즈를 추가해 가짜 레코드를 삽입하고, 이 가짜 레코드 역시 ORAM을 통해 전송한다. 이렇게 하면 서버는 실제 반환된 레코드 수와 가짜 레코드 수를 구분할 수 없으며, 전체 통신량이 (ε,δ)-DP를 만족한다.

시스템 설계에서 중요한 최적화는 두 가지이다. 첫째, 노이즈 양을 최소화하기 위해 쿼리별 민감도와 전체 프라이버시 예산을 정교히 할당한다. 저감된 노이즈는 불필요한 가짜 레코드 전송을 줄여 네트워크 비용을 크게 낮춘다. 둘째, 병렬 ORAM 구조를 도입해 하나의 쿼리를 여러 ORAM 인스턴스로 분할한다. 이때 각 ORAM에 할당되는 프라이버시 예산을 균등하게 배분하고, 전체 DP 보장을 위해 합성 프라이버시 분석을 수행한다. 결과적으로 라운드 트립 수가 크게 감소하고, 다중 코어 환경에서 거의 선형적인 속도 향상을 달성한다.

보안 모델인 CDP‑ODB는 서버가 ‘honest‑but‑curious’이며, 데이터와 쿼리 모두를 제어한다는 가정 하에 정의된다. 서버는 암호문과 메타데이터만을 관찰하고, 레코드 값, 정확한 AP, 정확한 CV를 알 수 없으며, (ε,δ)-DP 보장을 통해 단일 레코드가 식별될 확률을 제한한다. 논문은 이 모델에 대한 정형적인 정의와 보안 증명을 제공하며, 특히 DP가 전체 뷰(ORAM 접근 로그 + 통신량) 전체에 적용된다는 점을 강조한다.

성능 평가에서는 합성 데이터와 실제 의료 데이터셋을 사용해 10 M 레코드까지 확장성을 검증하였다. 범위 쿼리와 점 쿼리 모두에서 평균 응답 시간은 비보안 RDBMS 대비 4~8배, 완전 보안(전체 테이블 스캔) 대비 18배 정도 빠르며, 네트워크 트래픽도 실험적으로 최소화된 것을 확인했다. 또한, 병렬 ORAM을 8개까지 확장했을 때 처리량이 거의 7배 증가하는 등 확장성도 입증하였다.

요약하면, 𝔈psolute은 ORAM과 차등 프라이버시를 결합해 기존 시스템이 놓치던 CV 누출까지 완전히 차단하면서, 실용적인 성능을 유지하는 최초의 종합 솔루션이라 할 수 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기