정확한 베이지안 구조 학습을 위한 알고리즘과 복잡도 분석

초록

본 논문은 베이지안 구조 학습을 정확히 수행하는 알고리즘의 최악‑사례 복잡도를, 해결 후보 네트워크의 스켈레톤을 포함하는 무방향 그래프인 슈퍼‑구조에 대한 그래프 이론적 제한을 두고 분석한다. 슈퍼‑구조의 트리폭이 제한되고 최대 차수가 제한될 경우 각각 비균일 다항시간, 선형시간에 문제를 해결할 수 있음을 보이며, 이 두 제한을 동시에 포기하면 균일 다항시간 알고리즘이 존재하지 않을 가능성이 있음을 복잡도 가정 하에 증명한다. 또한, k‑이웃 로컬 서치(아크 추가·삭제·반전)에서도 동일한 제한이 필수적임을 보여준다.

상세 분석

베이지안 구조 학습은 주어진 데이터 집합에 대해 점수 함수가 최대가 되도록 하는 유향 비순환 그래프(DAG)를 찾는 문제이며, 점수 함수가 노드별 로컬 스코어의 합으로 분해될 때 특히 스코어 기반 접근법이 널리 사용된다. 이때 탐색 공간을 효과적으로 제한하기 위해 ‘슈퍼‑구조’라는 개념을 도입한다. 슈퍼‑구조는 모든 후보 네트워크의 스켈레톤(무방향 버전)이 포함된 무방향 그래프이며, 이 그래프의 구조적 특성이 알고리즘 복잡도에 직접적인 영향을 미친다.

논문은 먼저 슈퍼‑구조의 트리폭이 일정 상수 k 로 제한되는 경우를 고려한다. 트리폭이 제한되면 그래프는 트리 분해(tree decomposition)를 통해 작은 크기의 ‘bag’들로 나뉘며, 동적 계획법(dynamic programming)으로 각 bag 안에서 가능한 부모 집합을 열거하고, bag 간의 일관성을 유지하면서 전체 DAG를 구성할 수 있다. 이 과정은 각 bag의 크기가 k+1에 제한되므로, 상태 공간이 2^{O(k)} 정도로 제한되어 비균일 다항시간(입력 크기에 따라 차수가 달라지는 다항시간) 알고리즘이 가능함을 증명한다.

다음으로 최대 차수 Δ 가 상수로 제한되는 경우를 추가한다. 차수가 제한되면 각 노드가 가질 수 있는 부모 후보 수가 Δ 로 제한되므로, 동적 계획법에서 고려해야 할 경우의 수가 O(n·2^{Δ}) 로 감소한다. 트리폭 제한과 결합하면, 전체 알고리즘은 각 bag당 O(1) 시간 내에 처리할 수 있어 전체 복잡도가 O(|V|) 즉, 선형시간이 된다. 이는 베이지안 구조 학습에서 최초로 슈퍼‑구조의 두 가지 구조적 제한이 동시에 적용될 때 실용적인 효율성을 확보한다는 점에서 의미가 크다.

반면, 트리폭 제한만 없애거나 차수 제한만 없앨 경우 복잡도는 급격히 상승한다. 저자들은 트리폭이 무제한인 경우, 혹은 차수가 무제한인 경우에 대해 각각 NP‑hardness와 W