양방향 그래프 모델의 범주형 데이터 파라미터화와 적합

본 논문은 이산 확률분포에 대한 양방향 그래프 모델을 두 가지 방식으로 파라미터화하고, 변동 독립성을 확보할 수 있는 경우를 제시한다. 포화형에서는 다변량 로지스틱 변환을, 일반 경우에는 변동 독립성을 일부 보장하는 변형 파라미터화를 사용한다. 또한 Aitchison‑Silvey 방법을 확장한 최대우도 추정 알고리즘을 제안한다.

저자: Monia Lupparelli, Giovanni M. Marchetti, Wicher P. Bergsma

이 논문은 이산 확률분포에 적용 가능한 양방향 그래프 모델의 파라미터화와 최대우도 적합 방법을 체계적으로 제시한다. 먼저, 양방향 그래프는 무방향 그래프와 달리 간선이 양방향 화살표(←→)로 표시되며, 이는 변수 간의 주변 독립성을 나타낸다. 저자는 두 가지 마코프 성질, 즉 전역 마코프 성질과 연결 집합 마코프 성질을 소개하고, 이산 변수에 대해 두 성질이 동등함을 Drton‑Richardson(2007)의 결과를 인용해 증명한다. 이를 바탕으로, 그래프의 모든 분리된 집합 D에 대해 해당 변수들의 결합 확률이 각 연결 성분 C₁,…,C_r의 곱으로 분해되는 것이 모델의 정의가 된다. 다음으로, 모델을 파라미터화하기 위해 Bergsma‑Rudas(2002)의 완전 계층적(log‑linear) 파라미터화를 채택한다. 각 부분집합 M⊆V에 대해 로그선형 전개 log p_M(i_M)=∑_{L⊆M} λ_{ML}(i_L) 를 사용하고, λ_{ML}(i_L)는 Kronecker 곱을 이용해 행렬식 형태로 계산된다. 이때 기준 셀(i* )을 1로 고정함으로써 파라미터 수를 Q_v∈L(b_v−1) 로 줄인다. 포화 모델에서는 모든 가능한 L을 포함하는 다변량 로지스틱 변환이 등장한다. 이는 Glonek‑McCullagh(1995)의 다변량 로짓과 동일하며, 각 변수 수준에 대한 로그오즈 비율을 직접 해석할 수 있게 한다. 두 번째 파라미터화는 특정 고차 λ를 0으로 고정함으로써 변동 독립성(variation independence)을 확보한다. 변동 독립성은 파라미터 공간이 직교적인 구간으로 구성되어, 추정 과정에서 경계값에 얽매이지 않게 만든다. 이 파라미터화는 모든 경우에 적용되는 것은 아니지만, 그래프가 특정 구조(예: 트리형, 사슬형)를 가질 때 가능함을 증명한다. 저자는 이를 통해 “축소 모델(reduced model)”을 정의하고, 고차 상호작용을 제한함으로써 모델 복잡도를 효과적으로 제어한다. 최대우도 추정은 제약식이 있는 비선형 최적화 문제이다. 저자는 Aitchison‑Silvey(1958)의 라그랑주 승수 기반 알고리즘을 확장한다. 구체적으로, 제약식 g(θ)=0에 대해 라그랑주 함수 L(θ,λ)=ℓ(θ)+λᵗg(θ) 를 정의하고, Jacobian과 Hessian을 이용해 Newton‑Raphson 형태의 업데이트를 수행한다. 이때 제약식이 선형이 아니더라도, 선형 근사와 이차 근사를 반복 적용함으로써 수렴성을 확보한다. 알고리즘은 Lang(1996)와 Bergsma(1997)의 구현을 참고해 효율적인 행렬 연산을 제공한다. 실증 분석에서는 두 가지 실제 데이터를 사용한다. 첫 번째는 Coppens(1966)의 4개 이진 변수(안정성, 타당성, 우울증, 강직성) 데이터이며, 4‑chain 그래프가 적합함을 확인한다. χ² 검정 결과 개별 주변 독립성은 유의하지 않지만, 전체 모델은 자유도 5에 대해 deviance 8.61로 적합도가 양호하다. 두 번째는 Lienert(1970)의 LSD 후 증상 데이터로, 세 변수 간 쌍별 독립성은 관찰되지만 삼차 상호작용이 강하게 나타난다. 이는 단순 양방향 그래프 하나로는 설명되지 않으며, 최소 두 개의 간선을 포함하는 그래프가 필요함을 보여준다. 이러한 사례를 통해 제안된 파라미터화와 알고리즘이 실제 데이터의 복잡한 주변 독립 구조를 포착하고, 변동 독립성을 유지하면서도 효율적인 추정을 가능하게 함을 입증한다. 마지막으로 Drton‑Richardson(2007)의 Möbius 파라미터 기반 접근법과 비교한다. Möbius 파라미터는 이산 바이너리 경우에만 간단히 적용 가능하고, 고차 변수에 대해 해석이 어려운 반면, 본 논문의 로그선형 기반 파라미터는 일반적인 범주형 변수에 적용 가능하고, 각 파라미터가 직접적인 조건부 오즈 비율로 해석될 수 있다. 또한 변동 독립성을 보장하는 경우가 존재해 모델 선택과 사후 검정이 보다 직관적이다. 따라서 저자는 제안된 방법이 이론적 타당성, 계산 효율성, 실용적 해석 가능성 측면에서 기존 방법을 보완한다고 결론짓는다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기