실용적인 엔트로피 추정 알고리즘과 압축 카운팅의 샘플 복잡도 향상

데이터 스트림에서 p번째 빈도 모멘트를 추정하는 문제는 오래전부터 활발히 연구되어 왔으며, 엄격한 Turnstile 모델을 가정할 경우 p = 1일 때는 사실상 trivial한 문제이다. 본 논문에서는 p가 1에 근접할 때 샘플 복잡도가 거의 O(1)임을 보이는 새로운 알고리즘을 제안한다. 이는 기존에 알려진 O(1/ε²) 복잡도보다 현저히 개선된 결과이며, 부록에 포함된 실험을 통해 엔트로피 추정 문제가 손쉽게 해결될 수 있음을 입증한다.

저자: Ping Li

데이터 스트림의 p번째 빈도 모멘트를 추정하는 문제는 매우 활발히 연구된 분야이다. 엄격한 Turnstile 모델을 가정할 경우 p = 1일 때는 이 문제가 사실상 자명하다. 본 논문에서 제안하는 알고리즘은 p가 1에 근접할 때 샘플 복잡도가 거의 O(1)임을 보인다. 이는 기존에 알려진 O(1/ε²) 복잡도에 비해 크게 개선된 결과이며, 부록에 포함된 실험을 통해 엔트로피 추정 문제가 손쉽게 해결될 수 있음을 확인하였다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기