선형 비순환 인과 모델의 인과 구조 발견 임의 분포를 위한 통합 접근법

초록

본 논문은 연속형 데이터에 대한 선형 비순환 인과 모델을 대상으로, 기존의 조건부 독립성 기반 방법과 ICA 기반 방법의 한계를 극복하기 위해 두 접근을 일반화·통합한 새로운 인과 구조 학습 알고리즘을 제시한다. 임의의 비가우시안·가우시안 혼합 분포에서도 모델 식별이 가능하도록 그래프 이론적 동등성 조건을 정확히 규정하고, 시뮬레이션을 통해 기존 방법보다 높은 정확도와 식별력을 입증한다.

상세 분석

이 연구는 선형 비순환 구조(Linear Acyclic Model, LAM)를 가정하고, 각 변수는 다른 변수들의 선형 결합과 독립적인 외생 오차의 합으로 표현된다는 전제 하에 인과 구조를 추정한다. 기존 방법은 크게 두 갈래로 나뉜다. 첫 번째는 조건부 독립성 검정을 기반으로 하는 PC·FCI 계열으로, 그래프의 마크오프 이론에 따라 독립·비독립 관계를 탐색하지만, 동일한 독립성 집합을 공유하는 마크오프 동등 클래스 내에서는 방향을 구분하지 못한다는 근본적인 한계가 있다. 두 번째는 ICA 기반의 LiNGAM으로, 비가우시안 외생 오차가 존재할 경우 고유한 구조를 복원할 수 있지만, 일부 변수 혹은 전체가 가우시안인 경우에는 식별이 불가능해진다.

논문은 이러한 두 접근법을 하나의 프레임워크로 결합한다. 핵심 아이디어는 “임의 분포(arbitrary distribution)”를 허용하면서도, 변수 간 선형 관계와 외생 오차의 독립성이라는 최소 가정을 유지하는 것이다. 이를 위해 저자들은 두 모델이 동일한 확률 분포 가족을 생성하는 정확한 그래프 조건을 정리한다. 구체적으로, (1) 두 그래프가 동일한 부모-자식 관계 집합을 가질 경우, (2) 각 변수의 외생 오차가 가우시안·비가우시안 혼합 형태라도, 오차들의 고유한 비가우시안 성분이 충분히 존재하면 구조가 구별 가능하다는 정리를 제시한다. 이러한 정리는 기존 LiNGAM의 가정(전부 비가우시안)보다 완화된 것이며, 동시에 PC 계열이 제공하는 마크오프 동등성 구분 능력을 보완한다.

알고리즘은 크게 세 단계로 구성된다. 첫 단계에서는 전통적인 조건부 독립성 테스트를 수행해 가능한 DAG(Directed Acyclic Graph) 후보 집합을 축소한다. 두 번째 단계에서는 각 후보 그래프에 대해 외생 오차의 고차 통계량(예: 고계 모멘트, 고차 cumulant)을 추정해 비가우시안 성분의 존재 여부를 검증한다. 여기서 ICA 기법을 변형해, 전체 변수 집합이 가우시안일 경우에도 부분적인 비가우시안 성분을 탐지하도록 설계하였다. 마지막 단계에서는 위 두 정보를 통합해 가장 높은 사후 확률을 갖는 그래프를 선택한다. 이 과정에서 베이지안 모델 선택 기준을 적용해 과적합을 방지한다.

이론적 분석 외에도 저자들은 다양한 시뮬레이션을 수행한다. 데이터 생성 과정에서 가우시안·비가우시안 혼합 오차, 다양한 샘플 크기, 그리고 그래프 밀도 변화를 고려했으며, 기존 PC·FCI, LiNGAM, 그리고 최근의 GES와 같은 베이스라인과 비교했다. 결과는 특히 (i) 일부 변수만 비가우시안인 경우, (ii) 전체가 가우시안이지만 외생 오차가 서로 다른 분산을 갖는 경우, 그리고 (iii) 샘플 크기가 작아 독립성 테스트가 불안정한 상황에서 기존 방법보다 현저히 높은 정확도와 정밀도를 보였다.

이 논문의 주요 공헌은 다음과 같다. 첫째, 임의 분포 하에서 두 선형 비순환 모델이 동등함을 판단하는 그래프 이론적 기준을 제공함으로써 인과 구조 식별의 근본 한계를 명시적으로 확장하였다. 둘째, 조건부 독립성 검정과 고차 통계량 기반 비가우시안 검증을 결합한 혼합 알고리즘을 설계해, 가우시안·비가우시안 혼합 데이터에서도 안정적인 구조 복원을 가능하게 했다. 셋째, 광범위한 실험을 통해 제안 방법이 실제 데이터 분석에 적용될 수 있는 실용성을 입증하였다. 이러한 기여는 인과 추론 분야에서 기존 방법들의 제한점을 보완하고, 보다 일반적인 데이터 환경에 적용 가능한 새로운 패러다임을 제시한다.