중간값 기반 부분 사후분포 결합으로 구현하는 견고하고 확장 가능한 베이지안 추론

중간값 기반 부분 사후분포 결합으로 구현하는 견고하고 확장 가능한 베이지안 추론
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 데이터를 여러 비중첩 서브셋으로 나눈 뒤, 각 서브셋에 대해 독립적으로 사후분포를 추정하고, 이들 사후분포들의 기하학적 중간값(메디안)을 새로운 “M‑Posterior”로 정의한다. 제안 방법은 이상치에 대한 강인성을 이론적으로 보장하면서, 병렬 MCMC와 최소한의 통신으로 대규모 데이터에 적용할 수 있는 계산적 장점을 제공한다.

상세 분석

이 연구는 베이지안 추론의 두 가지 핵심 문제—대규모 데이터 처리와 이상치에 대한 강인성—를 동시에 해결하고자 한다. 핵심 아이디어는 전체 데이터 집합을 m 개의 서로 겹치지 않는 서브셋으로 분할하고, 각 서브셋 D_j 에 대해 전통적인 MCMC 혹은 변형된 샘플링 기법을 이용해 사후분포 π_j(·|D_j) 를 얻는 것이다. 이후, 확률측도 공간에 정의된 적절한 거리(주로 1‑Wasserstein 거리 혹은 RKHS 기반의 최대 평균 차이(MMD) 거리)를 이용해 이들 사후분포들의 기하학적 메디안을 정의한다. 구체적으로,
\


댓글 및 학술 토론

Loading comments...

의견 남기기