가장 설명 가능한 분류기: 점별 커버리지를 통한 선형 분류기의 최적성
본 논문은 “점별 커버리지(pointwise coverage)”라는 새로운 설명가능성 지표를 정의하고, 이를 기반으로 모든 분류기 중에서 가장 설명 가능한 모델을 이론적으로 규명한다. 저자는 분류기를 유클리드 공간의 파티션으로 모델링하고, 각 예측에 대한 설명을 동일 라벨을 공유하는 정의 가능한 단순 영역(오픈 볼)으로 본다. 이 영역의 반지름을 커버리지라 정의해 점별 커버리지를 측정한 결과, ‘정제된(linear) 이진 선형 분류기’만이 무한…
저자: Brett Mullins
본 논문은 머신러닝 모델의 설명가능성을 정량화하기 위해 ‘점별 커버리지(pointwise coverage)’라는 새로운 개념을 도입한다. 저자는 먼저 분류기를 ℝⁿ 공간의 파티션으로 정의한다. 파티션 P는 라벨 집합 Lₚ와 ‘정제 집합’ R으로 구성되며, R은 위상학적으로 meagre하고 Lebesgue 측면에서 널(null)인 집합으로 가정한다. 이는 경계가 거의 발생하지 않으며, 실제 연속 확률분포 하에서 데이터가 경계에 거의 놓이지 않음을 의미한다. 라벨 집합 Lₚ의 각 원소는 해당 라벨이 차지하는 영역이며, 각 점 x∈ℝⁿ에 대해 P(x)∈P는 x가 속한 파티션 원소를 의미한다.
설명의 정의는 ‘앵커(anchor)’라는 개념을 통해 이루어진다. x에 대한 앵커는 x를 포함하고, 동일 라벨 영역에 완전히 포함되는 오픈 볼 B(c,r)이다. 여기서 오픈 볼은 위상학적으로 가장 단순한 집합으로, Borel 계층에서 rank 1에 해당한다. 앵커의 반지름 r을 해당 앵커의 ‘커버리지’ cₚ(A)라 정의한다. 한 점 x에 대해 가능한 모든 앵커 집합 𝒜ₓ가 존재할 때, 점별 커버리지 Cₚ(x)=sup_{A∈𝒜ₓ} r는 x에 대한 최적 설명의 범위를 나타낸다. 만약 𝒜ₓ가 비어 있으면 Cₚ(x)=0이며, 무한히 큰 반지름을 갖는 앵커가 존재하면 Cₚ(x)=∞가 된다.
전체 모델의 설명력을 평가하기 위해 두 가지 집계값을 도입한다. 첫째, supₓ Cₚ(x)는 모델이 제공할 수 있는 최대 설명 범위를, 둘째, infₓ Cₚ(x)는 최소 설명 범위를 나타낸다. 특히, infₓ Cₚ(x)=∞인 경우를 ‘무한 점별 커버리지’를 가진다고 정의한다. 이는 모든 점에서 무한히 큰 설명 영역을 가질 수 있음을 의미한다.
논문의 핵심은 ‘정제된(linear) 이진 선형 분류기’를 정의하고, 이 클래스가 무한 점별 커버리지를 갖는 유일한 비자명 분류기임을 증명하는 것이다. 이진 선형 분류기는 두 라벨 M, N을 각각 열린 반평면과 닫힌 반평면으로 구분하고, 그 경계는 초평면이다. 경계 집합 R은 이 초평면 자체이며, 이는 meagre하고 Lebesgue 널이다. 이러한 구조 하에서, 각 라벨 영역은 무한히 큰 오픈 볼을 포함할 수 있으므로, 모든 점에 대해 Cₚ(x)=∞가 된다. 저자는 이를 ‘정제된(linear) 분류기’라 부르며, 정제된 선형 분류기의 정의를 일반화해 ‘정제된(linear) 분류기’라는 개념을 만든다.
정리 3.1에서는 “비자명 분류기 P가 무한 점별 커버리지를 갖는 경우는 오직 P가 정제된 선형 분류기일 때뿐이다”라고 명시한다. 이를 증명하기 위해, 먼저 선형 분류기의 각 라벨이 열린·닫힌 반평면이라는 기하학적 특성을 이용해 무한 반지름의 오픈 볼이 존재함을 보인다. 반대로, 비선형 혹은 복합적인 경계(예: 결정 트리, 신경망)의 경우 경계 근처에서 라벨이 교차하는 영역이 존재하므로, 어느 점에서도 무한히 큰 앵커를 찾을 수 없으며, 따라서 무한 점별 커버리지를 달성하지 못한다.
논문은 또한 ‘정제된(linear) 분류기’가 실제 데이터에 적용될 때의 의미를 논의한다. 선형 모델은 해석이 용이하고, 가중치와 임계값을 통해 직접적인 설명이 가능하다는 점에서 기존의 해석 가능성(interpretability) 개념과도 일치한다. 그러나 저자는 설명가능성(Explainability)과 해석 가능성(Interpretability)을 구분한다. 해석 가능성은 모델 구조 자체를 보는 것이고, 설명가능성은 특정 입력에 대해 “왜 이 라벨이 부여되었는가”를 설명하는 것이다. 점별 커버리지는 후자를 정량화한 지표이며, 선형 모델이 이 지표에서 최적임을 보임으로써 두 개념 사이의 연결 고리를 제공한다.
마지막으로, 저자는 정제된 선형 분류기 외에 무한 점별 커버리지를 가질 수 있는 다른 클래스가 존재하지 않음을 역으로 증명한다. 이는 모든 비선형 분류기가 적어도 하나의 점에서 커버리지가 유한하거나 0임을 의미한다. 따라서, 설명가능성을 최대로 추구한다면, 설계 단계에서 가능한 한 선형 구조를 유지하는 것이 이론적으로 최선의 선택이다.
전체적으로, 논문은 설명가능성을 기하학·위상수학적 관점에서 엄밀히 정의하고, 이를 통해 선형 분류기가 왜 직관적으로 가장 설명 가능한지 이론적으로 뒷받침한다. 다만, 실제 고차원 데이터에서 오픈 볼 형태의 앵커가 현실적인 설명으로 충분한지, 경계 집합을 무시 가능한 것으로 가정하는 것이 실제 데이터 분포에 적합한지 등에 대한 실증적 검증은 부족하다. 향후 연구에서는 다양한 데이터셋에 대한 실험적 평가와, 앵커 형태를 다각형·다중볼 등으로 확장하는 방안을 탐색할 필요가 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기