베이지안 네트워크는 일반적으로 충실한가
초록
이 논문은 모든 DAG 위의 베이지안 네트워크에서 충실성(faithfulness)이 전형적인 특성임을 보인다. 전체 베이지안 네트워크 집합에서는 총변동(total variation) 거리 기준으로 충실한 모델이 조밀하고 열린 집합이며, 조건부 지수족(conditional exponential families)이나 균등 연속·유계 밀도(non‑parametric)와 같은 실용적인 파라미터화 클래스에서도 동일한 위상학적 특성을 갖는다. 따라서 PC·FCI와 같은 제약 기반 인과 탐색 알고리즘은 이러한 “전형적인” 집합에서 일관성을 가진다.
상세 분석
본 연구는 베이지안 네트워크의 충실성 가정이 실제 통계 모델링에서 얼마나 일반적인지를 위상수학적·측도론적 관점에서 체계적으로 검증한다. 먼저, 어떤 DAG G에 대해 모든 가능한 마코프 커널을 총변동 거리 d_TV 로 정의한 메트릭 공간을 구축하고, 여기서 충실한 분포 집합이 조밀하고 열린(dense & open) 특성을 가진다는 정리를 증명한다. 이는 기존에 선형 가우시안 및 이산 베이지안 네트워크에 한정된 Lebesgue‑measure‑zero 결과를 일반화한 것으로, 전체 베이지안 네트워크 공간에 대해 “전형성(typicality)”을 위상학적 의미(comeager 집합)로 확장한다.
다음으로, 파라미터화된 모델 클래스인 조건부 지수족(conditional exponential families)을 고려한다. 정규성 가정(예: 충분히 부드러운 충분통계량, 파라미터 공간의 열린성) 하에 파라미터 공간 Θ는 유클리드 공간이며, 여기서 충실한 파라미터 집합이 조밀하고 열린 동시에 Lebesgue 측면에서 영집합이 아님을 보인다. 즉, 무신뢰 파라미터는 측도론적으로 거의 없으며, 위상학적으로도 nowhere‑dense 로서 “비전형적”이다. 이 결과는 기존의 Spirtes‑Meek 정리를 일반적인 지수족으로 확장한다.
비파라메트릭 경우에는, 모든 조건부 밀도가 균등 연속(equicontinuous)하고 균등하게 유계(bounded)하다는 가정 하에, 동일한 조밀·열림 특성을 d∘T_V 메트릭과 약한 위상(weak topology) 모두에서 확보한다. 특히, 이 클래스에서는 총변동 위상과 약한 위상이 일치하므로, 수렴 개념이 통계적 검정과 직접 연결된다.
잠재 변수(Latent variable) 모델에 대해서도, “잠재 투영(latent projection)”에 대한 충실성만을 요구하면 위의 결과가 그대로 유지됨을 증명한다. 이는 FCI와 같은 알고리즘이 잠재 변수 존재 상황에서도 일관성을 유지함을 의미한다.
마지막으로, 조건부 독립성 검정이 일관적(consistency)이라는 기존 결과(Genin‑Kelly, Lauritzen)를 활용해, 충실성의 위상학적 특성과 결합하면 PC·FCI 같은 제약 기반 인과 탐색 알고리즘이 “열린·조밀” 집합, 즉 전형적인 베이지안 네트워크에서 통계적으로 일관된 추론을 제공한다는 결론을 도출한다. 전체적으로 이 논문은 충실성 가정이 단순한 편의적 가정이 아니라, 다양한 모델 클래스와 위상에서 실제로 전형적인 현상임을 수학적으로 확증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기