제한 없는 다변량 스키우 t 혼합 모델을 위한 EM 알고리즘 패키지

본 논문은 제한 없는 다변량 스키우 t(FM‑uMST) 혼합 모델의 최대우도 추정을 위한 폐쇄형 EM 알고리즘을 구현한 R 패키지 EMMIX‑uskew를 소개한다. 제한된 형태의 스키우 t와 달리 완전한 비제한 모델을 사용함으로써 비대칭·중량 꼬리 데이터를 보다 정확히 모델링한다. 패키지는 2‑3 차원 등고선 시각화와 샘플 생성 기능을 제공하며, 흐름세포계측 데이터와 AIS 데이터 등에 적용해 기존 제한형 모델 대비 군집 정확도가 향상됨을 보인…

저자: Sharon X. Lee, Geoffrey J. McLachlan

제한 없는 다변량 스키우 t 혼합 모델을 위한 EM 알고리즘 패키지
본 논문은 제한 없는 다변량 스키우 t(FM‑uMST) 혼합 모델을 위한 최대우도 추정 방법과 이를 구현한 R 패키지 EMMIX‑uskew를 상세히 소개한다. 연구 배경으로는 비대칭·중량 꼬리 특성을 갖는 이질적 데이터에 대한 모델링 필요성이 대두되었으며, 특히 흐름세포계측(flow cytometry) 데이터와 같은 고차원 생물학적 데이터에서 기존의 다변량 정규 혼합 모델이나 제한형 스키우 t 혼합 모델이 충분히 데이터를 설명하지 못한다는 점이 제시된다. 이러한 한계를 극복하기 위해 저자들은 비제한 형태의 다변량 스키우 t 분포를 구성요소로 하는 혼합 모델을 채택하고, 이를 위한 EM 알고리즘을 폐쇄형으로 유도한다. 모델 정의에서는 각 관측치 \(y_i\)가 \(g\)개의 스키우 t 성분 중 하나에 속한다고 가정하고, 각 성분은 위치벡터 \(\mu_k\), 공분산 행렬 \(\Sigma_k\), 스키우 파라미터 \(\lambda_k\), 자유도 \(\nu_k\)를 가진다. 비제한 형태는 스키우 파라미터가 전체 차원에 대해 자유롭게 설정될 수 있음을 의미한다. 저자들은 스키우 t 분포를 정규–가우시안 혼합 형태로 재표현함으로써, 잠재 변수인 스케일 변수 \(W_i\)와 스키우 변수 \(U_i\)에 대한 조건부 기대값을 명시적으로 계산한다. E‑step에서는 현재 파라미터 추정치 \(\Theta^{(t)}\) 하에 \(\mathbb{E}

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기