가변 길이 문자열에 대한 반복 해시의 보편성

이 논문은 문자열을 한 문자씩 순차적으로 처리하는 반복 해시 함수의 독립성 특성을 연구한다. 저자는 반복 해시가 쌍별 독립성을 가질 수 있지만 3-차 독립성은 불가능함을 증명하고, 해시값의 개수보다 훨씬 긴 문자열에 대해서도 거의 보편적인 충돌 확률을 유지할 수 있음을 보인다. 또한 충돌 확률과 허용 가능한 최대 문자열 길이 사이의 관계를 수학적으로 제한한

초록

상세 요약

논문은 먼저 반복 해시(iterated hash)의 정의를 명확히 한다. 입력 문자열 s = (c₁,c₂,…,cₙ)을 처리할 때, 초기값 h₀와 전이 함수 f를 이용해 hᵢ = f(hᵢ₋₁, cᵢ) (i=1…n) 형태로 해시값을 순차적으로 계산한다. 여기서 f는 고정된 함수이며, 전체 해시값은 hₙ이다. 저자는 이 구조가 전통적인 다항식 해시나 CRC와 같은 기존 방법과 동일한 모델임을 강조한다.

핵심 이론적 결과는 두 가지이다. 첫째, 적절히 설계된 전이 함수 f와 초기값 h₀를 선택하면, 서로 다른 두 문자열 x, y에 대해 해시값이 독립적으로 균등 분포를 가짐을 보인다. 즉, Pr

초록

상세 요약

📜 논문 원문 (영문)