고차원 그래프 모델 정규화 선택을 위한 안정성 기반 방법 StARS
StARS는 무향 그래프 추정 시 정규화 파라미터를 데이터에 의존적으로 선택하는 새로운 안정성 기반 기법이다. 최소한의 정규화로 그래프를 희소하게 만들고, 무작위 샘플링에 대해 재현성을 확보한다는 직관적 해석을 제공한다. 이론적으로는 완전한 희소성(sparsistency)을 부분적으로 보장하며, 실험에서는 K‑CV, AIC, BIC 등 기존 방법을 모두 능가한다.
저자: Han Liu, Kathryn Roeder, Larry Wasserman
본 연구는 고차원 무향 그래프 모델, 특히 Gaussian Graphical Model(GGM)에서 정규화 파라미터 λ를 데이터에 의존적으로 선택하는 새로운 방법인 StARS(Stability Approach to Regularization Selection)를 제안한다. 기존에 널리 사용되는 K‑fold 교차검증(K‑CV), Akaike 정보 기준(AIC), Bayesian 정보 기준(BIC) 등은 차원(p)이 샘플 수(n)보다 크게 될 때 과적합이나 과소적합 문제를 일으키며, 특히 그래프 구조가 희소해야 하는 상황에서 신뢰할 수 있는 모델 선택이 어려웠다. 이러한 한계를 극복하고자 저자들은 “안정성(stability)”이라는 개념을 도입하였다.
StARS의 핵심 아이디어는 다음과 같다. 원본 데이터셋을 B개의 부트스트랩 혹은 무작위 서브샘플(각 서브샘플 크기는 n·α, 여기서 0<α≤1)으로 나눈다. 각 서브샘플에 대해 동일한 정규화 파라미터 λ를 적용해 그래프 구조를 추정한다(예: graphical lasso). 그 후, 각 가능한 엣지(e_{ij})에 대해 서브샘플들에서 해당 엣지가 선택된 비율을 계산한다. 이 선택 확률을 \hat{π}_{ij}(λ)라 하면, 전체 그래프에 대한 평균 불안정도는
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기