연속시간 베이지안 네트워크

연속시간 베이지안 네트워크

초록

연속시간 베이지안 네트워크(CTBN)는 유한 상태 변수를 연속 시간 마코프 과정으로 모델링하고, 각 변수의 전이 강도(transition intensity)를 부모 변수들의 현재 상태에 의존하도록 정의한다. 이를 통해 복잡한 동적 시스템을 그래프 구조로 표현하고, 언제 변수값이 변하고 어떤 값으로 변하는지를 확률적으로 기술한다. 논문은 CTBN의 확률 의미론, 가능한 질의 유형, 정확 추론의 어려움, 그리고 구조적 특성을 활용한 근사 추론 알고리즘을 제시한다.

상세 분석

본 논문은 연속시간 베이지안 네트워크(CTBN)를 정형화함으로써, 이산 상태 변수가 연속 시간 흐름 속에서 어떻게 상호작용하는지를 체계적으로 기술한다. 핵심 아이디어는 각 로컬 변수 v 를 유한 상태 연속시간 마코프 과정으로 모델링하고, 그 전이 강도 행렬 Q_v 을 v 의 현재 값과 부모 집합 Pa(v) 의 현재 값에 조건부로 정의한다는 점이다. 이렇게 하면 전체 시스템은 다변량 연속시간 마코프 과정이 되지만, 변수별 전이 강도가 독립적으로 정의되므로 그래프 구조를 통한 모듈화가 가능해진다.

논문은 먼저 CTBN의 확률 의미론을 제시한다. 생성 모델은 “시간에 따라 발생하는 이벤트 시퀀스”를 샘플링하는 방식으로, 각 변수는 현재 상태와 부모 상태에 따라 지수분포형 대기시간을 갖고, 대기시간이 끝나면 전이 확률에 따라 새로운 상태로 전이한다. 이 과정은 전통적인 연속시간 마코프 체인과 달리 변수 간 동시 전이를 허용하지 않으며, 따라서 이벤트는 순차적으로 발생한다. 이러한 정의는 CTBN가 완전한 마코프 과정임을 보장하고, 상태공간이 급격히 커지는 문제를 그래프 구조를 이용해 완화한다.

다음으로 논문은 CTBN에 대해 할 수 있는 질의 유형을 분류한다. (1) 시간 전후 예측 – 현재 관측을 기반으로 미래 특정 시점의 변수 분포를 추정, (2) 간격 질의 – 두 시점 사이에 발생할 이벤트의 기대 횟수나 분포, (3) 조건부 확률 – 특정 변수의 값이 주어졌을 때 다른 변수의 미래 분포, (4) 경로 가능성 – 특정 상태 전이가 일정 시간 안에 일어날 확률 등이다. 이러한 질의는 모두 연속시간 마코프 과정의 전이 행렬을 이용해 이론적으로 정의될 수 있지만, 실제 계산은 상태공간이 지수적으로 늘어나기 때문에 비현실적이다.

정확 추론의 어려움은 두 가지 차원에서 나타난다. 첫째, 전이 강도가 시간에 따라 변하지 않더라도, 변수 간 의존성 때문에 전체 전이 행렬은 |X| = ∏_v |Dom(v)| 크기의 희소하지만 여전히 거대한 행렬이 된다. 둘째, 질의가 요구하는 것은 전이 행렬의 지수함수(e^{Qt})와 같은 연산인데, 이는 행렬 지수 계산이 O(|X|^3) 비용을 요구한다는 점에서 실용적이지 않다. 따라서 정확한 마진 분포를 구하려면 복잡도 완화가 필수적이다.

이를 해결하기 위해 논문은 구조적 근사 추론 알고리즘을 제안한다. 핵심은 각 변수별로 조건부 독립성을 유지하면서, 전체 시스템을 여러 개의 작은 마코프 과정으로 분해하는 것이다. 구체적으로, 변수 v 에 대한 조건부 강도 행렬 Q_v|Pa(v) 을 고정하고, 다른 변수들의 현재 상태를 고정된 “배경”으로 간주한다. 그런 다음 변수별 전이 확률을 독립적으로 업데이트하고, 전체 분포는 믹스처(혼합) 형태로 근사한다. 이 과정은 변분 베이즈 혹은 점근적 라플라스 근사와 유사하게, 복잡한 전이 행렬 대신 각 변수에 대한 작은 행렬만을 다루므로 계산량이 크게 감소한다. 알고리즘은 반복적인 전파 단계정규화 단계를 포함하며, 수렴 조건을 만족하면 근사 마진을 얻는다. 실험 결과는 이 근사법이 정확 추론에 비해 오차가 작으면서도 실행 시간이 급격히 단축됨을 보여준다.

마지막으로 논문은 제한점과 향후 연구 방향을 논한다. 현재 모델은 정적 그래프 구조를 가정하고, 전이 강도가 부모 상태에만 의존한다는 제한이 있다. 실제 시스템에서는 동적 구조 변화시간에 의존적인 강도가 필요할 수 있다. 또한, 근사 알고리즘의 오차 경계를 이론적으로 분석하는 작업이 남아 있다. 이러한 점들을 보완하면 CTBN은 생물학적 신호 전달, 네트워크 트래픽, 금융 시장 등 연속시간 복합 시스템 모델링에 강력한 도구가 될 것이다.