검색과 근사 멤버십을 위한 초소형 데이터 구조

이 논문은 키 집합 S에 대한 함수 f 를 저장하면서 S 자체를 저장하지 않는 ‘retrieval’ 문제와, 허용 오차 ε 내에서 멤버십을 판단하는 ‘approximate membership’ 문제를 다룬다. 기존 최소 완전 해시가 요구하던 Θ(n) 비트 오버헤드를 없애고, nr 비트(또는 (1+γ)nr 비트) 수준의 공간에 O(k) 조회 시간을 제공한다. 핵심은 가중치가 작은 무작위 0‑1 행렬이 전 행렬 순위를 가질 확률에 대한 Calkin…

저자: Martin Dietzfelbinger, Rasmus Pagh

논문은 정적 사전 문제의 두 변형, retrieval과 approximate membership를 다루며, 두 문제 모두 기존 최소 완전 해시(MPH) 기반 접근법이 갖는 Θ(n) 비트의 공간 오버헤드를 제거하는 것을 목표로 한다. 1. **문제 정의 및 동기** - *retrieval*: 집합 S⊂U, |S|=n에 대해 함수 f:S→{0,1}^r을 정확히 저장하고, U∖S에 대해서는 임의 값을 허용한다. - *approximate membership*: false positive 확률 ε (=2^{−r}) 이하로 x∈S 여부를 판단한다. - 기존 방법은 최소 완전 해시를 사용해 S를 저장하지 않지만, 해시 테이블을 위한 n·log₂e 비트(≈1.44n) 정도의 부가 공간이 필요했다. 2. **핵심 기술: 저중량 무작위 행렬** - 각 키 x에 대해 k 개의 해시 함수 h₁,…,h_k 가 정의하는 위치 집합 A_x⊂

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기