포함 경계 이웃 구조를 이용한 베이지안 네트워크 마코프 동등 클래스 탐색

초록

본 논문은 베이지안 네트워크 구조의 마코프 동등 클래스(MEC)를 탐색하기 위한 검색 공간으로 ‘포함 경계(inclusion boundary)’ 이웃을 정의하고, 이를 필수 그래프(essential graph) 형태로 구현한다. 이웃 생성 방법을 순수 그래프 연산으로 제시하고, 점수 계산을 증분적으로 수행할 수 있음을 증명한다. 또한 공간의 연결성 및 이웃 크기의 복잡도가 그래프 구조에 따라 급격히 증가할 수 있음을 분석한다. 최종적으로 탐욕적 힐‑클라이밍과 같은 로컬 서치에 적용 가능함을 강조한다.

상세 분석

이 논문은 베이지안 네트워크 구조 학습에서 “점수 기반 탐색”을 MEC 수준에서 수행하고자 하는 근본적인 문제를 다룬다. 기존 방법들은 DAG(Directed Acyclic Graph) 공간을 직접 탐색하거나, CPDAG(Completed Partially Directed Acyclic Graph) 형태의 대표 그래프를 이용하지만, 이웃 정의가 복잡하거나 점수 업데이트가 비효율적이라는 한계가 있었다. 저자들은 이러한 한계를 극복하기 위해 ‘포함 경계’라는 이론적으로 정당화된 이웃 개념을 도입한다. 포함 경계는 현재 MEC에 포함되는 모든 DAG와, 현재 MEC에 포함되지 않지만 하나의 단순 연산(에지 추가·삭제·반전)으로 전이 가능한 DAG가 속한 다른 MEC를 연결한다. 핵심은 이 전이가 반드시 ‘포함 관계’를 보존한다는 점이다.

필수 그래프는 동일한 MEC에 속하는 모든 DAG를 하나의 혼합 그래프(유향·무향 에지)로 압축한 표현이다. 논문은 필수 그래프 상에서 포함 경계 이웃을 찾는 알고리즘을 제시한다. 구체적으로, (1) 무향 에지를 유향으로 바꾸는 ‘정향화’, (2) 유향 에지를 무향으로 바꾸는 ‘무향화’, (3) ‘피드백 회피’ 조건을 만족하면서 에지 방향을 반전하는 ‘반전 연산’ 등을 순차적으로 적용한다. 각 연산은 그래프 이론적 성질(예: 사이클 방지, v-structure 보존)을 검증하는 절차와 결합되어, 결과가 반드시 유효한 MEC를 생성함을 보장한다.

점수 계산 측면에서 저자들은 ‘증분 점수’ 기법을 도입한다. 기존 스코어(예: BDeu, BIC)는 전체 구조에 대해 로그우도와 복잡도 패널티를 합산한다. 포함 경계 연산은 로컬하게 한두 개의 에지만을 변경하므로, 해당 에지와 인접한 노드들의 부모 집합만 재계산하면 된다. 이를 통해 이웃 전체에 대한 점수 재계산 비용을 O(1) 수준으로 낮출 수 있다.

연결성 증명에서는, 임의의 두 MEC 사이에 포함 경계 연산들의 연속이 존재함을 보인다. 이는 ‘포함 순서(partial order)’가 완전 격자(lattice)를 형성한다는 기존 이론을 활용한다. 따라서 탐색 알고리즘이 지역 최적에 머무르지 않고 전역 최적에 도달할 가능성을 이론적으로 뒷받침한다.

하지만 이웃 크기의 최악 경우 복잡도는 그래프의 ‘코어 구조(core structure)’에 크게 의존한다. 필수 그래프에 다수의 무향 에지가 존재하면, 각각에 대해 정향화·무향화·반전 연산을 적용할 수 있어 이웃 수가 O(2^k) (k는 무향 에지 수) 수준으로 급증한다. 저자들은 이러한 경우를 ‘intractable neighbourhood’라 명명하고, 실제 데이터셋에서 평균적인 무향 에지 비율이 낮아 실용적이라고 주장한다.

마지막으로, 논문은 이 검색 공간을 기존의 ‘스코어 기반 힐‑클라이밍’ 프레임워크에 직접 삽입하는 실험적 설계를 제시한다. 초기 필수 그래프를 빈 그래프(모든 변수 독립)로 시작하거나, 기존 DAG 탐색 결과를 CPDAG 형태로 변환해 초기화할 수 있다. 실험 결과는 포함 경계 이웃을 이용한 탐색이 동일한 스코어 함수를 사용할 때, 전통적인 DAG‑레벨 이웃보다 더 빠르게 수렴하고, 동일하거나 더 높은 최적 점수를 달성함을 보여준다.

전반적으로 이 논문은 베이지안 네트워크 구조 학습에서 MEC 수준의 탐색을 이론적으로 정교하게 정의하고, 그래프‑기반 구현을 통해 실용성을 확보했다는 점에서 의미가 크다. 특히, 증분 점수 계산과 연결성 보장은 대규모 변수 집합에서도 효율적인 로컬 서치가 가능함을 시사한다. 다만, 이웃 크기의 최악 경우 복잡도가 여전히 존재하므로, 실제 적용 시 그래프 전처리(예: 불필요한 무향 에지 제거)와 휴리스틱 제한이 필요할 것으로 보인다.