ECSEL 서명식 방정식 기반 설명 가능한 분류
초록
ECSEL은 클래스별 서명식(signomial) 방정식을 학습해 분류와 동시에 수식 형태의 설명을 제공한다. 서명식이 물리·공학 데이터에서 자주 나타나는 구조임을 이용해, 경사 기반 최적화와 ℓ1 정규화를 통해 모델 복잡도를 제어한다. 실험 결과, AI Feynman 벤치마크에서 기존 심층 기법보다 적은 연산량으로 목표 방정식을 더 많이 복원했으며, 전통적인 분류 모델과 동등한 정확도를 유지한다. 또한 전역 탄성계수, 결정 경계 민감도, 로컬 기여도 등 세 단계의 해석 가능성을 수식적으로 제공한다. 전자상거래와 사기 탐지 사례에서도 데이터 편향을 드러내고, 반사실(counterfactual) 분석과 실무적 인사이트를 얻을 수 있음을 보였다.
상세 분석
ECSEL은 기존 심볼릭 회귀(symbolic regression)와 설명 가능한 분류(explainable classification)의 장점을 결합한 새로운 프레임워크이다. 핵심 아이디어는 데이터에 내재된 멱법칙(power‑law) 형태를 서명식(signomial)이라는 유한 개의 곱셈 항으로 표현하고, 각 클래스마다 독립적인 서명식 점수 함수를 학습한다는 점이다. 서명식은
(z(x)=\sum_{k=1}^{K}\alpha_k\prod_{j=1}^{m}x_j^{\beta_{k,j}})
와 같이 정의되며, 여기서 (\alpha_k)는 계수, (\beta_{k,j})는 실수 지수이다. 저자들은 이 형태가 연속 함수 공간에서 조밀(dense)함을 정리 3.1을 통해 증명하고, 로그 변환 후 선형 함수와 동등시켜 Stone‑Weierstrass 정리를 적용함으로써 보편적 근사 능력을 확보한다.
학습 과정에서는 교차 엔트로피 손실에 지수 파라미터 (\beta)에 대한 ℓ1 정규화를 추가한다. ℓ1 정규화는 불필요한 지수를 0에 가깝게 수축시켜 자동 변수 선택(feature selection)을 촉진하고, 최종 방정식의 가독성을 높인다. 최적화는 표준 확률적 경사 하강법(SGD) 혹은 Adam과 같은 변형을 사용하며, 수치적 안정성을 위해 입력을 양수 구간(
댓글 및 학술 토론
Loading comments...
의견 남기기