신뢰성 높은 불확실성 분리를 위한 크레딧 개념 병목 모델

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 예측 불확실성을 모델의 무지(에피스테믹)와 데이터 자체의 모호성(알레아트릭)으로 명확히 구분하기 위해, 예측 분포를 집합(credal set)으로 표현하는 새로운 프레임워크를 제안한다. 이를 Concept Bottleneck Model에 적용해 두 개의 독립적인 불확실성 헤드를 설계하고, 서로 겹치지 않는 그래디언트 경로와 별도 손실 함수를 통해 구조적으로 분리한다. 실험 결과, 기존 방법에 비해 에피스테믹·알레아트릭 불확실성 간 상관관계가 10배 이상 감소하고, 각각 예측 오류와 인간 주석자 간 의견 차이와 높은 정합성을 보였다.

상세 분석

이 논문은 불확실성 추정에서 가장 근본적인 문제인 “예측 분포만으로는 에피스테믹과 알레아트릭을 동시에 복원할 수 없다”는 이론적 한계를 명확히 제시한다. Tomov et al. (2025)의 결과를 인용해, 다중 라벨이 존재하는 상황에서는 동일한 마진 확률 p(y|x) 가 두 가지 전혀 다른 원인—모델의 혼란 혹은 데이터 자체의 불확실성—에 의해 발생할 수 있음을 강조한다. 기존의 베이지안 딥러닝, MC‑Dropout, 앙상블 등은 모두 동일한 예측 확률을 기반으로 에피스테믹(예: 모델 샘플 간 변동)과 알레아트릭(예: 엔트로피) 를 추정한다. 이때 두 추정치는 동일한 함수 형태에 의존하므로 강한 양의 상관관계를 띠게 되고, 실제 의미론적 구분이 무너지게 된다.

저자들은 이를 해결하기 위해 “구조적 분리(structural separation)”라는 개념을 도입한다. 구체적으로는 (i) 에피스테믹과 알레아트릭을 서로 다른 파라미터 집합(ϕ_epi, ϕ_ale) 로 명시적으로 모델링하고, (ii) 각각의 파라미터가 받는 학습 신호를 완전히 분리된 그래디언트 흐름으로 제한한다. 이를 구현하기 위해 기존 Concept Bottleneck Model(CBM)의 아이디어를 확장한다. CBM은 입력을 인간이 해석 가능한 개념 공간으로 매핑하고, 개념 레이블을 통해 최종 태스크를 수행한다는 점에서 다중 주석자 데이터와 자연스럽게 결합된다. 논문은 각 개념을 확률 분포가 아니라 “credal set”—즉, 로그잇 공간에서 타원형(ellipsoid) 형태의 집합—으로 정의한다. 이 타원형은 중심 μ와 두 종류의 공분산(Σ_epi, σ²_ale) 으로 파라미터화되며, Σ_epi 는 집합의 크기(에피스테믹 불확실성) 를, σ²_ale 는 집합 내부의 노이즈(알레아트릭 불확실성) 를 나타낸다.

아키텍처는 고정된 사전학습 인코더와 세 개의 독립적인 헤드로 구성된다. 첫 번째 헤드는 μ 를 예측해 개념의 평균 분포를 만든다. 두 번째 헤드인 에피스테믹 헤드는 Σ_epi 를 출력하고, 이는 Hausdorff KL 정규화와 오류 기반 손실을 통해 학습된다. 여기서 오류 기반 손실은 실제 라벨과의 차이를 스케일링하여 credal set 의 크기를 조절한다. 세 번째 알레아트릭 헤드는 σ²_ale 를 예측하며, 다중 주석자의 의견 불일치 엔트로피를 직접 목표로 사용한다. 중요한 점은 각 헤드가 서로 다른 파라미터 공간에 투사된 특징(h_μ, h_epi, h_ale) 로부터 입력을 받으며, 이 투사는 정규화된 직교 행렬을 사용해 서로 겹치지 않게 만든다. 결과적으로 그래디언트는 각각의 손실에만 영향을 미치게 되고, Theorem 3.1 에서 수식적으로 증명된다.

이 구조적 설계는 두 가지 실질적인 이점을 제공한다. 첫째, 에피스테믹과 알레아트릭 불확실성이 학습 과정에서 서로 간섭하지 않으므로, 최종 추정치 간 상관관계가 자연스럽게 감소한다. 둘째, 알레아트릭 불확실성은 실제 주석자 간 의견 차이를 직접 감독받기 때문에, “데이터 자체의 모호성”을 정확히 반영한다. 실험에서는 CEBaB, HateXplain, GoEmotions 등 다중 주석자 데이터와, Tomov et al. (2025) 가 제공한 MA‑QA/AmbigQA와 같은 정답 분포가 알려진 데이터셋을 사용했다. 모든 베이스라인(Ensemble, Kendall, ENN 등) 대비 에피스테믹·알레아트릭 상관계수 ρ가 0.9 수준에서 0.06 수준으로 급격히 낮아졌으며, 에피스테믹 불확실성은 예측 오류와 높은 피어슨/스피어만 상관을 보이고, 알레아트릭 불확실성은 p* 엔트로피와 거의 1에 가까운 상관을 기록했다. 또한, 구조적 분리를 적용하지 않은 경우에도 그래디언트 흐름을 억제하는 단순한 정규화만으로는 충분히 상관을 끊어내지 못한다는 부가 실험 결과도 제시한다.

요약하면, 이 논문은 불확실성 분해가 근본적으로 “같은 예측 분포에서 두 정보를 끌어내는” 알게된 한계에 직면했음을 확인하고, 이를 극복하기 위한 설계 원칙(파라미터와 그래디언트의 완전 분리)을 제시한다. Credal CBM은 이러한 원칙을 실제 모델에 구현함으로써, 에피스테믹과 알레아트릭을 의미론적으로 독립적인 두 신호로 변환한다. 이는 의료, 법률, 자동화된 의사결정 등 고위험 분야에서 불확실성 기반 의사결정의 신뢰성을 크게 향상시킬 잠재력을 가진다.

신뢰성 높은 불확실성 분리를 위한 크레딧 개념 병목 모델

초록

상세 분석

댓글 및 학술 토론

의견 남기기