퀵소트 복잡도 정밀 분석: 수렴 오차의 정규성
초록
무작위 순열에 대한 퀵소트 비교 횟수의 정규화된 복잡도 Yₙ은 거의 확실히 한계 변수 Y에 수렴한다. 본 논문은 이 수렴의 오차 항에 대해 중앙극한정리를 증명하여, √(n/(2 log n))·(Yₙ−Y) 가 표준 정규분포로 수렴함을 보인다.
상세 분석
본 연구는 퀵소트 알고리즘의 비교 횟수 복잡도를 확률론적 관점에서 정밀히 분석한다. 기존 문헌에서는 무작위 순열에 대해 정규화된 복잡도 Yₙ = (Cₙ−2n log n)/n 이 거의 확실히 한계 변수 Y에 수렴한다는 사실이 알려져 있다. 여기서 Cₙ은 퀵소트가 수행한 비교 횟수이며, Y는 Rösler가 제시한 고정점 방정식 T ≍ U·T₁+(1−U)·T₂+g(U) 로 정의되는 비정규분포를 가진 랜덤 변수이다. 이 한계는 마팅게일 수렴을 이용해 증명되었으며, Yₙ의 변동성은 O(√(log n)/n) 수준임이 알려졌다. 그러나 수렴 속도와 오차 항의 분포적 특성에 대한 정량적 결과는 부족했다.
저자들은 Yₙ−Y 를 정규화하여 √(n/(2 log n))(Yₙ−Y) 가 표준 정규분포 N(0,1) 로 수렴한다는 중앙극한정리를 제시한다. 핵심 아이디어는 Yₙ을 재귀적 분할 구조에 기반한 마팅게일 차분으로 표현하고, 차분들의 분산이 점차 감소함을 보이는 것이다. 구체적으로, 퀵소트의 분할 과정은 무작위 이진 탐색 트리와 동형이며, 각 노드에서 발생하는 비교 횟수는 독립적인 균등 변수 U에 의해 결정된다. 이를 이용해 Yₙ을 다음과 같이 전개한다:
Yₙ = U·Y_{⌊U n⌋} + (1−U)·Y_{⌈(1−U)n⌉} + ξₙ,
여기서 ξₙ은 현재 단계에서 발생하는 비교 횟수의 평균 보정항이다. 이 재귀식은 Rösler의 고정점 방정식과 구조적으로 동일하므로, 차분 Dₙ = Yₙ−Y 가 마팅게일 차분열을 형성한다. 저자들은 Dₙ의 2차 모멘트를 정밀히 계산하여 Var(Dₙ) ≈ 2 log n / n 임을 얻는다. 따라서 √(n/(2 log n))·Dₙ 의 분산은 1에 수렴한다.
다음 단계에서는 Lindeberg–Feller 조건을 검증한다. 차분 ξₙ 은 유한한 3차 모멘트를 가지며, 큰 차분이 발생할 확률은 n 이 커짐에 따라 급격히 감소한다. 이를 통해 차분열이 점차 정규화된 형태로 수렴함을 보인다. 또한, 마팅게일 중심극한정리(MCLT)를 적용하기 위해 차분들의 조건부 분산이 전체 분산에 비해 균등하게 기여함을 확인한다.
결과적으로, √(n/(2 log n))(Yₙ−Y) ⇒ N(0,1) 가 성립한다. 이 정리는 기존의 거의 확실히 수렴하는 결과를 보강하여, 실제 알고리즘 실행 시 오차가 정규분포를 따른다는 실용적 통찰을 제공한다. 또한, n/(log n) 스케일이 자연스럽게 나타나는 이유는 퀵소트의 분할 깊이가 평균적으로 O(log n) 이며, 각 레벨에서 발생하는 비교 횟수의 변동성이 O(1) 수준이기 때문이다.
댓글 및 학술 토론
Loading comments...
의견 남기기