연속시간 베이지안 네트워크의 기대최대화와 복합 지속시간 분포

초록

연속시간 베이지안 네트워크(CTBN)의 파라미터와 구조를 부분 관측 데이터에서 학습하기 위해 EM과 구조 EM을 적용하였다. 또한 CTBN에 위상(phase) 분포라는 반파라메트릭 지속시간 모델을 도입해 지수/기하 분포의 제한을 극복하고, 실제 인구 수명 데이터에서 모델의 타당성과 DBN 대비 성능 향상을 실증하였다.

상세 분석

본 논문은 연속시간 베이지안 네트워크(CTBN)의 학습 문제를 두 가지 차원에서 확장한다. 첫 번째는 부분 관측(partially observed) 데이터에 대한 기대최대화(EM)와 구조 기대최대화(SEM) 알고리즘을 설계한 것이다. CTBN은 각 변수마다 부모 변수에 조건부로 정의된 연속시간 마코프 프로세스를 갖는 그래프 모델이며, 관측이 불완전할 경우 전통적인 최대우도 추정이 불가능하다. 저자들은 완전 데이터의 충분통계량을 기대값으로 대체하는 E‑step을 정의하고, M‑step에서는 각 변수의 전이율과 조건부 강도 행렬을 닫힌 형태로 업데이트한다. 특히 사이클이 허용되는 구조에서도 베이즈 네트워크와 유사하게 로컬 파라미터 업데이트가 가능하도록 수식화하였다.

두 번째 확장은 지속시간 분포의 표현력을 강화한 것이다. 기존 CTBN은 전이 간격이 지수분포(또는 DBN에서는 기하분포)로 제한돼 실제 현상—예를 들어 인간 수명처럼 비대칭적이고 꼬리가 두꺼운 분포—를 모델링하기에 부적절했다. 이를 해결하기 위해 위상(phase) 분포를 도입하였다. 위상 분포는 일련의 연결된 지수 단계들의 합으로 구성되며, 단계 수와 전이 구조를 조절함으로써 임의의 양의 연속분포를 임의의 정확도로 근사할 수 있다. 논문에서는 각 변수의 조건부 지속시간을 독립적인 위상 분포 집합으로 매핑하고, EM 알고리즘 내에서 위상 파라미터(전이율 및 초기 단계 확률)를 동시에 추정한다. 이 과정에서 위상 분포의 구조가 변수 간 의존성 그래프와 별개로 학습되므로, 모델 복잡도와 표현력 사이의 트레이드오프를 구조 EM을 통해 자동으로 조정한다.

실험에서는 실제 인구 수명 데이터(출생 연도, 사망 연도, 성별 등)를 사용해 부분 관측 상황을 시뮬레이션하였다. EM/SEM 기반 CTBN은 완전 관측이 없는 경우에도 의미 있는 인과 구조(예: 연령이 사망 위험에 미치는 직접·간접 효과)를 복원했고, 위상 분포를 적용한 모델은 로그우도와 예측 정확도에서 전통적인 DBN 및 지수‑제한 CTBN을 크게 앞섰다. 특히 위상 단계 수가 늘어날수록 모델은 장기간 지속시간의 꼬리를 더 정확히 포착했으며, 과적합을 방지하기 위해 BIC 기반 단계 선택이 효과적이었다.

이 논문은 (1) 부분 관측 데이터에 대한 EM/SEM 프레임워크를 CTBN에 적용한 이론적 기여, (2) 위상 분포를 통한 지속시간 표현 확장이라는 실용적 혁신, (3) 실제 데이터에 대한 정량적 검증이라는 세 축을 동시에 만족한다는 점에서 연속시간 확률 그래프 모델링 분야에 중요한 전진을 제시한다.