LSH 하한의 최적화 ρ 파라미터는 1/c 로 제한된다

본 논문은 Hamming 거리 공간에서 LSH(Locally Sensitive Hashing)의 ρ 파라미터에 대한 하한을 완전히 정밀하게 규명한다. 기존에 알려진 0.46 /c 수준의 하한을 개선하여, ρ ≥ 1 /c − oₙ(1)임을 보인다. 증명은 불리언 함수의 노이즈 안정성 S_f(e^{−t})가 t에 대해 로그-볼록임을 이용한다. 결과는 Hamming 공간뿐 아니라 Euclidean ℓ₂, ℓ_s 전반, 그리고 Jaccard 거리에도 …

저자: Ryan ODonnell, Yi Wu, Yuan Zhou

논문은 고차원 이진 벡터 공간 {0,1}^d 에서 Hamming 거리 기반 LSH(Locality Sensitive Hashing)의 이론적 한계를 다룬다. LSH는 (r, cr, p, q)-민감 해시 패밀리를 정의하며, 여기서 r 이하의 거리쌍은 충돌 확률 ≥ p, cr 이상은 ≤ q 를 만족한다. LSH의 효율성은 ρ = ln(1/p)/ln(1/q) 로 측정되며, ρ가 작을수록 근사 최근접 이웃(NN) 검색에 필요한 공간·시간 복잡도가 낮아진다. 기존 연구인 Indyk‑Motwani는 좌표 해시 {x↦x_i} 로 ρ ≤ 1/c 를 달성했으며, Motwani‑Naor‑Panigrahy는 ρ ≥ (e^{1/c}−1)/(e^{1/c}+1) ≈ 0.46/c 라는 하한을 제시했다. 그러나 이 하한은 상한과 차이가 있었고, 특히 q가 충분히 큰 경우에만 적용되었다. 저자들은 이 격차를 메우기 위해 새로운 하한 ρ ≥ 1/c − o_d(1) 를 증명한다. 핵심 아이디어는 불리언 함수의 노이즈 안정성 S_f(ρ) 를 활용하는 것이다. ρ‑correlated 두 문자열 (x,y) 를 정의하고, S_f(ρ)=E

LSH 하한의 최적화 ρ 파라미터는 1/c 로 제한된다

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기