규칙 기반 컴플라이언스 모니터링을 위한 베이지안 프레임워크
초록
본 논문은 사전에 알려진 규제 규칙을 사전 확률로 활용하고, 관측 데이터의 불완전성과 잡음을 고려해 규칙 활성화·컴플라이언스 비율·파라미터 변동이라는 잠재 상태를 베이지안 사후 추정으로 복원하는 RSI 프레임워크를 제안한다. 이론적으로 O(1) 규제 업데이트, Bernstein‑von Mises 일관성, ELBO 단조 수렴을 보장하며, 토고 재정 데이터를 기반으로 한 합성 벤치마크에서 라벨 없이 F1 = 0.519, AUC = 0.599를 달성하고 규제 변경 적응 속도가 600배 이상 향상됨을 실증한다.
상세 분석
RSI는 기존의 규칙 학습 기반 접근법(MLN, PSL, 감독 학습)과 근본적으로 방향을 반전시킨다. 규칙 자체를 ‘진리’가 아니라 사전 확률 분포로 모델링함으로써, 관측 데이터가 불완전하거나 전략적으로 왜곡될 경우에도 규칙의 권위는 유지된다. 잠재 상태 공간 S = {(a_i, c_i, δ_i)}는 각 규칙에 대해 활성화 여부(a_i), 실제 컴플라이언스 비율(c_i), 파라미터 드리프트(δ_i)를 포함한다. a_i는 베르누이(π_i)로, π_i는 정책 입장에서 사전 기대 활성화 확률을 반영한다. c_i는 베타(α_i, β_i)로, 규칙이 활성화된 경우 기대 컴플라이언스 수준을 표현한다. δ_i는 정규(N(0,σ_i²))로 파라미터 변동성을 포착한다. 이러한 구조적 사전은 도메인 전문가가 직접 설정할 수 있어, 규제 변화가 발생하면 사전 비율만 교체하면 O(1) 비용으로 업데이트가 가능하다(정리 1).
우도 함수는 규칙이 적용 가능한 경우와 그렇지 않은 경우를 구분한다. 적용 가능 시, 관측 d_j는 해당 규칙의 컴플라이언스 신호 L(d_j|r_i, c_i, δ_i)와 결합되고, 비활성화 시 작은 오류 ε_i가 부여된다. 결측 데이터는 P(d_j|S)=1 로 처리해 사전을 그대로 유지한다는 점이 결측에 강건한 설계이다.
사후 추정은 평균장(mean‑field) 변분 추론으로 근사한다. Q_ϕ(S) = ∏_i Q(a_i)Q(c_i)Q(δ_i) 형태를 취하고, 베타‑이항, 베르누이, 정규‑정규 conjugate 관계를 이용해 폐쇄형 업데이트 식을 도출한다. 각 좌표 업데이트는 KL 최소화와 동등하게 ELBO를 비감소시키므로 정리 3에 의해 수렴이 보장된다.
이론적 보장은 세 가지 핵심 측면을 다룬다. 첫째, 규제 업데이트 비용이 데이터 규모와 무관하게 O(1)이라는 점은 실무에서 빈번한 법령 개정에 즉각 대응할 수 있게 한다. 둘째, Bernstein‑von Mises 정리를 이용해 m→∞ 일 때 사후가 정상분포로 수렴함을 증명함으로써 충분한 관측이 쌓이면 사전 영향이 사라지고 정확한 상태 추정이 가능함을 보인다(정리 2). 셋째, 변분 ELBO가 단조 증가함을 보장해 알고리즘이 발산하지 않으며, 실제 실험에서도 7회 이내에 수렴한다.
실험에서는 토고 재정 규칙을 기반으로 만든 합성 데이터셋(RSI‑Togo‑Fiscal‑Synthetic v1.0) 2,000개 기업을 사용한다. 라벨이 전혀 없는 제로샷 설정에서도 RSI는 F1 0.519, AUC 0.599를 기록했으며, 규제 변경(VAT 임계값 상승) 후 업데이트 시간은 1 ms 미만으로, XGBoost 재학습(≈700 ms) 대비 600배 이상 빠르다. 또한 20%~50% 결측 상황에서도 성능 저하가 미미하고, 베이지안 불확실성 추정이 점점 감소하는 모습을 보여 정리 2와 일치한다.
전체적으로 RSI는 규칙 기반 도메인에서 ‘규칙을 배우는’ 것이 아니라 ‘규칙을 이용해 상태를 추정하는’ 새로운 패러다임을 제시한다. 사전 설계가 핵심이지만, 전문가 지식이 풍부한 재무·법률·의료 등 다양한 분야에 바로 적용 가능하며, 순차적 확장(칼만 필터와 유사)이나 대규모 규칙 그래프(베리프 전파)와 결합해 확장성을 높일 여지도 충분히 존재한다.
댓글 및 학술 토론
Loading comments...
의견 남기기