최소패널티 기반 데이터 구동 회귀 패널티 보정

본 논문은 최소제곱 회귀에서 패널티 곱셈 상수의 최적값을 데이터만으로 추정하는 알고리즘을 제시한다. 기존의 Birgé‑Massart 최소패널티 개념을 일반화하여, 이질분산·비가우시안 상황에서도 적용 가능한 ‘슬로프 휴리스틱’을 도입하고, 회귀그램의 구간폭 선택 문제를 중심으로 비대칭 설계와 비정규 상황에 대한 비점근적 이론을 제공한다.

저자: Sylvain Arlot (LM-Orsay, INRIA Futurs), Pascal Massart (LM-Orsay

본 논문은 최소제곱 회귀 모델 선택에서 패널티 곱셈 상수 K의 최적값을 데이터만으로 추정하는 새로운 방법론을 제시한다. 전통적인 AIC, Mallows Cp 등은 K가 고정되거나 사전에 알려진 잡음 분산 σ²에 의존한다는 한계가 있다. Birgé와 Massart(2007)는 가우시안·동질분산 상황에서 최소패널티 K_min을 정의하고, 최적 패널티는 K_opt = 2 K_min이라는 슬로프 휴리스틱을 제안했지만, 그 적용 범위는 제한적이었다. 저자들은 이 접근을 크게 확장한다. 첫째, 회귀 모델을 임의의 설계와 이질분산·비가우시안 오류까지 포함하도록 일반화한다. 관측 모델 Y_i = s(X_i)+σ(X_i)ε_i 로 가정하고, ε_i는 평균 0, 분산 1인 독립 잡음이며 σ(·)는 위치에 따라 변할 수 있다. 위험을 Pγ(t) = E

최소패널티 기반 데이터 구동 회귀 패널티 보정

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기