EAGLE 정보이득 기반 지역 설명을 위한 적응형 교란 선택

EAGLE은 베이지안 선형 서브스티튜트 모델에 기대 정보이득을 활용한 활성학습 기준을 적용해, 블랙박스 모델의 개별 예측을 설명하는 교란 샘플을 효율적으로 선택한다. 지역 가중치를 유지하면서 후행 불확실성을 최소화하고, 설명의 재현성·안정성을 향상시키며, 이론적으로 O(d log t) 의 누적 정보이득과 선형 샘플 복잡도를 보장한다.

저자: Sumedha Chugh, Ranjitha Prasad, Nazreen Shah

본 논문은 블랙박스 머신러닝 모델의 개별 예측을 설명하기 위한 포스트‑hoc 모델‑불가지론 접근법의 핵심 과제인 “교란 샘플 선택”을 정보이론적 활성학습 문제로 재정의한다. 저자들은 먼저 기존 LIME, US‑LIME, BayesLIME, GLIME 등은 교란을 무작위 혹은 휴리스틱하게 생성해 설명의 재현성·안정성에 한계를 보인다는 점을 지적한다. 특히 베이지안 방법이 불확실성을 정량화하긴 하지만, 교란 선택 단계에서 지역성(locality) 정보를 충분히 활용하지 못한다는 문제를 제기한다. 이를 해결하기 위해 제안된 EAGLE(Expected Active Gain for Local Explanations)은 베이지안 선형 회귀를 서브스티튜트 모델로 채택하고, 사전으로 ϕ∼N(0,σ²I), σ²∼Inv‑χ²를 설정한다. 교란 z는 인스턴스 x₀와의 거리 기반 지역 가중치 πₓ₀(z)로 가중되며, 이는 가까운 교란일수록 더 높은 정밀도로 모델링됨을 의미한다. 사후는 닫힌 형태의 평균 ˆϕ와 공분산 Vϕ를 제공하고, Vϕ⁻¹는 현재까지 수집된 교란들의 가중 외적 합으로 표현된다. EAGLE의 핵심 기여는 기대 정보이득(EIG) 기반 획득 함수 A_E(z)=E_{y|z}

EAGLE 정보이득 기반 지역 설명을 위한 적응형 교란 선택

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기