고차원 상관 데이터 온라인 변분 베이즈 추정

본 논문은 수백만 수준의 관측치를 갖는 고차원 데이터에서 시공간 상관을 동시에 모델링할 수 있는 계층적 회귀 프레임워크를 제시한다. 공통 요인과 피험자별 로딩을 결합한 동적 요인 모델에 조건부 자기회귀(CAR) 구조를 적용하고, 피험자 간 이질성을 디리클레 과정으로 표현한다. 메모리 제한을 극복하기 위해 데이터를 부분적으로 읽어들이면서 변분 베이즈 추정을 순차적으로 업데이트하는 온라인 알고리즘을 개발하였다. 시뮬레이션과 무릎 골관절염 MRI 데…

저자: Sylvie Tchumtchoua, David B. Dunson, Jeffrey S. Morris

고차원 상관 데이터 온라인 변분 베이즈 추정
본 논문은 고차원 데이터, 특히 수백만 개의 관측치를 포함하고 시공간적으로 상관된 데이터를 효율적으로 분석하기 위한 새로운 통계적 프레임워크와 알고리즘을 제시한다. 연구 동기는 현대 생의학·신경과학·사회과학 등에서 대규모 이미지·시계열 데이터가 급증함에 따라 기존의 전통적 베이즈 방법(MCMC)이나 두 단계 접근법이 메모리·시간 제약으로 실용적이지 못하다는 점이다. 이를 해결하기 위해 저자들은 세 가지 주요 목표를 설정하였다. 첫째, 공간·시간 상관을 동시에 모델링할 수 있는 유연한 계층적 회귀 모델을 설계한다. 둘째, 피험자 간 이질성을 비모수적 디리클레 과정(DP)으로 표현한다. 셋째, 전체 데이터를 한 번에 메모리로 로드하지 않고도 추정을 수행할 수 있는 온라인 변분 베이즈(Online VB) 알고리즘을 개발한다. 1. **모델 설계** - 관측치 \(Y_{it}\) (i: 피험자, t: 시간, k: 공간 단위)는 다음과 같이 표현된다. \

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기