범주론적 설명자 펑터를 통한 AI 분류기 논리 설명
초록
본 논문은 범주론을 이용해 포스트‑hoc XAI 기법의 논리 규칙 추출 과정에서 발생하는 일관성 결함을 해결한다. 연속적인 퍼지 함수와 부울 설명 사이를 구조적으로 보존하는 ‘설명자 펑터’를 정의하고, δ‑coherent 함수군을 범주화한 뒤 부울 함수 범주로 사상한다. 합성 가능하고 충실한 설명을 보장하는 이론적 틀을 합성된 합성 논리 벤치마크에 적용해 모순·비충실 설명을 크게 감소시켰음을 실험적으로 입증한다.
상세 분석
이 연구는 현재 XAI 분야에서 가장 널리 쓰이는 포스트‑hoc 방법이 모델의 내부 연산을 논리 규칙 형태로 추출하지만, 연속적인 신경망 출력과 이산적인 부울 규칙 사이의 변환 과정에서 논리적 일관성이 깨지는 문제점을 지적한다. 저자들은 이를 해결하기 위해 두 개의 범주—퍼지 함수 범주 F와 부울 함수 범주 B—사이를 연결하는 ‘설명자 펑터(Explaining Functor)’를 제안한다. 핵심 아이디어는 입력·출력 공간을 특정 투사 δ(예: 임계값 이진화)로 제한하고, δ‑coherent 라는 새로운 함수 클래스를 정의함으로써 δ‑coherent 함수들만이 범주 C_δ의 사상으로 허용되게 하는 것이다. 정의 1에서 δ‑coherent는 δ∘f = δ∘f∘δ 를 만족하는 함수로, 이는 입력을 δ‑정규화한 뒤 함수 적용과 다시 δ‑정규화를 하는 과정이 동일함을 의미한다. 이 조건은 최소 t‑norm과 같은 일부 퍼지 연산은 만족하지만, Łukasiewicz t‑norm 등은 만족하지 않아 일관성 문제가 발생한다는 점을 예시로 든다.
정리 1에서는 δ‑coherent 함수들만을 객체와 사상으로 하는 범주 C_δ가 닫힌 구조임을 증명한다. 이어서 정의 2와 정리 2를 통해 C_δ에서 B로의 펑터 F_δ를 정의한다. 이 펑터는 객체를 동일 차원의 이진 벡터로 매핑하고, 사상은 단순히 δ∘f 로 구현된다. 펑터의 구성 조건인 항등성 보존과 합성 보존은 δ‑coherent 성질 덕분에 자동으로 만족된다. 따라서 부울 논리식은 원래 퍼지 함수의 논리적 함의를 정확히 반영한다.
하지만 모든 퍼지 함수가 δ‑coherent하지 않다. 저자들은 두 가지 보정 전략을 제시한다. 첫 번째는 입력 차원을 확장해 비‑coherent 성분을 별도의 변수로 분리하는 ‘Domain Extension’(정리 3)이며, 두 번째는 출력값을 δ‑coherent 함수 g 로 교체하는 ‘Output Modification’(정리 4)이다. 두 방법 모두 함수 자체를 변형해 δ‑coherent하게 만들지만, 변형 과정이 합성성을 보존하지 못한다는 점을 정리 5와 정리 5의 증명에서 강조한다. 즉, 보정된 함수 Γ는 일반적인 함수 합성에 대해 Γ(g∘f) ≠ Γ(g)∘Γ(f) 를 만족할 수 있다.
이를 극복하기 위해 저자들은 ‘δ‑coherency 함수’ Γ를 정의하고, 함수 전체 집합 F_h 위에 동치 관계 ≡_Γ를 도입한다(정의 4, 레마 3). 그러나 여전히 Γ가 합성성을 갖지 않음이 정리 5에서 증명된다. 따라서 비‑coherent 함수를 직접 δ‑coherent 범주에 사상하는 일반적인 방법은 존재하지 않으며, 현재 제시된 두 보정 방법은 특정 상황에만 적용 가능함을 인정한다.
실험 부분에서는 논리 연산자(AND, OR, NOT 등)로 구성된 합성 퍼지 함수들을 사용해 합성 가능한 δ‑coherent 함수군을 구축하고, 이를 설명자 펑터에 적용해 부울 규칙을 추출한다. 결과는 기존 포스트‑hoc 기법이 생성하는 모순 규칙(예: 동일 입력에 대해 서로 다른 클래스 라벨을 부여) 대비 70% 이상 감소된 모순률을 보이며, 설명의 충실도(원 모델 출력과 부울 규칙의 일치도)도 크게 향상됨을 보고한다.
이 논문은 XAI에서 ‘설명’ 자체를 수학적 구조(범주)로 모델링함으로써, 설명의 일관성·합성성을 형식적으로 보장할 수 있음을 보여준다. 다만 δ‑coherent 조건이 실제 복잡한 딥러닝 모델에 얼마나 일반화될 수 있는가, 그리고 보정 과정이 모델 성능에 미치는 영향 등에 대한 추가 연구가 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기