네트워크 복제 기반 베이지안 신뢰망 평균·분산 정확도 향상
초록
본 논문은 베이지안 신뢰망(Bayesian belief network)에서 질의(query)의 평균과 분산을 보다 정확히 추정하기 위한 새로운 방법을 제시한다. 기존의 델타 방법(delta‑method) 기반 근사에 비해, 두 개의 독립 복제 네트워크를 이용한 “네트워크 복제(doubling)” 기법을 적용해 질의 평균을 확장하고, 이를 바탕으로 분산 근사를 개선한다. 완전 데이터 상황을 가정하며, 이산·연속·하이브리드 형태의 네트워크 모두에 적용 가능하도록 설계되었다. 실험 결과는 제안 방법이 평균 오차와 분산 오차 모두에서 기존 방법을 현저히 능가함을 보여준다.
상세 분석
베이지안 신뢰망은 변수들 간의 조건부 의존성을 방향성 비순환 그래프로 표현하고, 각 노드의 조건부 확률표(CPT) 혹은 연속형 변수의 경우 회귀모형 등으로 매개변수를 정의한다. 매개변수 자체를 확률 변수로 모델링하면, 데이터에 대한 사후분포를 통해 매개변수 불확실성을 정량화할 수 있다. 질의는 이러한 매개변수들의 함수이므로, 질의 자체도 확률 변수가 된다. 기존 연구(Van Allen 등, 2001, 2008)는 질의 평균을 사후 평균으로 직접 계산하고, 분산은 일차 미분을 이용한 델타 방법으로 근사하였다. 그러나 델타 방법은 1차 테일러 전개에 의존하므로, 매개변수 분포가 비대칭이거나 질의가 비선형일 경우 근사 오차가 크게 발생한다.
본 논문은 이러한 한계를 극복하기 위해 “네트워크 복제”라는 아이디어를 도입한다. 두 개의 독립 복제 네트워크를 동시에 고려함으로써, 질의 평균을 두 복제의 곱 형태인 E