글로벌 특성 효과 추정 오류 원인 분석

본 논문은 부분 의존도(PD)와 누적 지역 효과(ALE) 플롯이라는 두 대표적인 전역 특성 효과 추정 방법의 오류 구조를 체계적으로 분해한다. 모델 편향·분산, 추정 편향·분산 네 가지 요소로 구성된 평균제곱오차(MSE) 분해식을 제시하고, 학습 데이터와 보류 데이터(hold‑out) 사용 시 발생하는 차이를 이론적으로 분석한다. 시뮬레이션을 통해 보류 데이터 사용이 이론적으로 가장 깨끗하지만, 실제로는 학습 데이터 사용에 따른 편향이 무시할 …

저자: Timo Heiß, Coco Bögel, Bernd Bischl

글로벌 특성 효과 추정 오류 원인 분석
본 논문은 전역 특성 효과 해석 도구인 부분 의존도(Partial Dependence, PD)와 누적 지역 효과(Accumulated Local Effects, ALE)의 추정 오류를 체계적으로 분석한다. 먼저 데이터 생성 과정을 \((X,Y)\sim P_{XY}\) 로 정의하고, 학습 알고리즘이 만든 모델 \(\hat f\) 를 확률 변수로 간주한다. 전역 특성 효과는 두 단계의 기대값으로 표현되며, PD는 \(\text{PD}_{\hat f,S}(x_S)=\mathbb{E}_{\bar S}

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기