온라인 FDR 절차를 강화하는 e‑클로저와 복합 e‑값 기법

본 논문은 연속적으로 들어오는 가설 스트림에 대해, 임의의 의존성을 허용하면서도 거짓 발견률(FDR)을 제어하는 새로운 온라인 절차들을 제시한다. 핵심 아이디어는 온라인 e‑클로저 원리를 도입하고, ‘기부(donation)’ 개념을 활용한 온라인 복합 e‑값을 정의함으로써 기존 e‑LOND·r‑LOND 등과 같은 방법들을 엄격히 개선하는 것이다. 또한 제안된 알고리즘은 각 시점 t 에서 O(log t) 시간만에 결정을 내릴 수 있어 실용성을 높…

저자: Ziyu Xu, Lasse Fischer, Aaditya Ramdas

본 연구는 현대 데이터 과학에서 가설이 연속적으로 생성·검정되는 온라인 환경을 대상으로, 거짓 발견률(FDR)을 엄격히 제어하면서 검정 파워를 극대화하는 새로운 통계적 프레임워크를 제시한다. 기존의 온라인 FDR 절차(e‑LOND, r‑LOND 등)는 임의의 의존성을 허용하지만, 테스트 레벨을 고정된 형태로 설정함으로써 파워 손실이 발생한다. 이를 해결하기 위해 저자들은 두 가지 혁신적인 아이디어를 도입한다. 첫 번째는 ‘온라인 e‑클로저 원리(Online SupFDR e‑closure)’이다. 전통적인 클로저 원리는 모든 부분 가설 집합에 대한 검정을 동시에 수행해 전체 가설에 대한 결정을 도출한다. 온라인 상황에서는 정보가 시간에 따라 누적되므로, 클로저 집합을 점진적으로 확장해야 한다. 이를 위해 ‘증가하는 e‑컬렉션(increasing e‑collection)’을 정의하고, 각 시간 t에서 후보 거절 집합 Cₜ를 e‑값들의 선형 결합 형태로 구성한다. 구체적으로, E_S = Σ_{i∈S} γ_{|S∩

온라인 FDR 절차를 강화하는 e‑클로저와 복합 e‑값 기법

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기