제로인플레이션 포아송 회귀의 부분선형 모델을 위한 강건 EM 유사 알고리즘

본 논문은 구조적 영(0)와 일반 포아송 카운트를 혼합한 제로인플레이션 포아송(ZIP) 모델에 비선형 효과를 허용하는 부분선형 구조(PLZIP)를 대상으로, 기존 최대우도법의 취약성을 극복하기 위해 로버스트 손실함수를 결합한 EM‑like 알고리즘을 제안한다. 알고리즘 수렴성, 추정량의 일관성 및 점근적 정규성을 이론적으로 증명하고, 다양한 오염 시나리오를 포함한 시뮬레이션과 실제 의료 데이터 적용을 통해 전통적 추정법 대비 뛰어난 견고성과 효…

저자: María José Llop, Andrea Bergesio, Anne-Françoise Yao

제로인플레이션 포아송 회귀의 부분선형 모델을 위한 강건 EM 유사 알고리즘
본 논문은 “부분선형 제로인플레이션 포아송(PLZIP) 모델”이라는 복합적인 통계 모델을 대상으로, 기존 최대우도법이 갖는 취약점을 보완하고자 로버스트 추정 방법을 개발한다. PLZIP 모델은 응답 변수 y가 구조적 영(Zero‑inflated)와 일반 포아송 카운트 두 구성요소의 혼합으로 이루어지며, 평균 구조는 log(λ)=xᵀβ+m(t) 로 표현되는 부분선형 형태를 갖는다. 여기서 x는 선형 효과, t는 비선형 효과를 담당하는 단일 연속 변수이며, m(·)는 미지의 매끄러운 함수이다. 기존 연구들은 β, γ(구조적 영 로짓 파라미터)와 m을 추정하기 위해 sieve ML, B‑spline 기반 프로파일링 등을 사용했지만, 데이터에 이상치가 포함되거나 모델 가정이 약간이라도 위배될 경우 추정이 크게 왜곡되는 문제가 있었다. 저자들은 이러한 문제를 해결하기 위해 다음과 같은 전략을 채택한다. 첫째, 잠재 변수 w_i(구조적 영 여부)를 도입해 완전 데이터 로그우도 ℓ_c(y,w,θ)를 구성한다. 이 로그우도는 β와 m에 관한 항, γ에 관한 항으로 완전히 분리될 수 있어 각각 독립적으로 최적화가 가능하다. 둘째, EM‑like 알고리즘을 적용해 w_i의 기대값 E(w_i|y_i,θ^{(r)}) 를 E‑step에서 계산하고, M‑step에서는 기존 3‑step 프로파일링 절차를 그대로 사용하되, 각 단계의 목적함수를 로버스트 손실 ρ(y,u) 로 대체한다. ρ는 bounded φ와 보정항 G를 포함해 Fisher‑consistency를 만족하도록 설계되었으며, Ψ(y,u)=∂ρ/∂u 가 연속이고 E

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기