컴플라이언스 인식 예측 프로세스 모니터링을 위한 신경 심볼릭 접근법

본 논문은 Logic Tensor Networks(LTN)를 활용해 도메인 규칙을 모델에 주입함으로써, 기존의 데이터‑기반 예측 프로세스 모니터링이 갖는 규정 위반 문제를 해결한다. 네 단계(특징 추출·규칙 추출·지식베이스 구축·지식 주입) 파이프라인을 제안하고, 실제 의료 로그 4종에 대해 정확도와 규정 준수율 모두에서 기존 LSTM·Transformer 기반 모델을 능가함을 실증한다.

저자: Fabrizio De Santis, Gyunam Park, Wil M. P. van der Aalst

컴플라이언스 인식 예측 프로세스 모니터링을 위한 신경 심볼릭 접근법
본 논문은 예측 프로세스 모니터링(PPM) 분야에서 데이터‑기반 서브심볼릭 모델이 도메인 규칙을 반영하지 못하는 문제를 해결하고자, Logic Tensor Networks(LTN)를 활용한 신경‑심볼릭 접근법을 제안한다. 서론에서는 PPM이 비즈니스 프로세스의 미래 상태를 예측하는 핵심 기술임을 강조하고, 기존 LSTM·Transformer 기반 모델이 규정·비즈니스 룰을 명시적으로 고려하지 못해 컴플라이언스 위반 위험이 존재함을 지적한다. 이를 보완하기 위해 신경‑심볼릭 AI가 통계적 학습과 논리적 추론을 결합하는 방법론으로 소개된다. 관련 연구에서는 기존 PPM의 딥러닝 발전과, 제한적으로 제어‑흐름 제약을 입력·출력 수준에서 적용한 연구들을 정리한다. 특히, δILP, DeepProbLog, Semantic Loss, KENN 등 다양한 신경‑심볼릭 기법을 언급하지만, 이들 대부분이 시간·페이로드와 같은 복합적인 규칙을 다루지 못하거나, 규칙 적용이 단일 레이어에 국한된다는 한계를 지적한다. 본 논문의 핵심 기여는 네 단계로 구성된 파이프라인이다. 1) **특징 추출**: 이벤트 로그에서 제어‑흐름, 시간, 페이로드 세 종류의 특징을 정의한다. 제어‑흐름 특징은 활동 존재 여부(HasAct) 등을, 시간 특징은 대기시간·활동 지속시간 등을, 페이로드 특징은 환자 연령·전처리 결과·약물 투여 등 케이스·이벤트 수준 데이터를 포함한다. 2) **규칙 추출**: 선언적 마이닝(Declarative mining)으로 제어‑흐름 규칙을 LTL 형태로 도출하고, SLA 분석으로 시간 규칙을, 통계적 상관관계 분석으로 페이로드 규칙을 자동 생성한다. 도메인 전문가의 지식도 수동으로 보강한다. 3) **지식베이스 구축**: 추출된 규칙을 1차 논리식으로 형식화하고, 클래스‑독립·클래스‑종속(결과‑지향·비결과‑지향)으로 분류한다. 이렇게 구성된 KB는 LTN의 SatAgg 연산을 통해 전체 제약 만족도를 계산한다. 4) **지식 주입**: LTN 기반 이진 분류기(활동 시퀀스를 입력으로 하는 LSTM·Transformer + MLP)를 베이스라인으로 삼아, KB를 세 가지 방식으로 주입한다. (① 입력 레벨에서 특징 공간을 확장, ② 출력 레벨에서 클래스 예측을 논리식으로 재정의, ③ 병렬 목표로 추가 제약을 최적화에 포함). LTN의 핵심 메커니즘은 퍼지 논리 연산을 이용해 논리식의 만족도를 연속적인 손실 함수로 변환하고, 전체 손실 L = 1 – SatAgg(…)을 최소화하면서 모델 파라미터와 논리식 만족도를 동시에 학습한다. 논문은 p‑norm 파라미터를 통해 제약 위반에 대한 페널티 강도를 조절할 수 있음을 보인다. 실험에서는 네 개의 실제 의료 프로세스 로그(수술 전후 절차)를 사용해 컴플라이언스‑인식 테스트 세트를 구성하였다. 비교 대상은 순수 LSTM·Transformer 모델, 그리고 Semantic Loss와 같은 기존 규칙 인코딩 기법이다. 평가 지표는 정확도(Accuracy)와 규정 준수율(Compliance)이며, 제안 모델은 모든 데이터셋에서 평균 5%p 이상의 정확도 향상과 7%p 이상의 규정 준수율 상승을 기록했다. 특히, 학습 데이터에 규정 위반 사례가 희박한 경우에도 LTN 기반 제약이 모델을 올바른 방향으로 유도해 성능 저하를 방지하였다. 논문의 한계로는 규칙 추출 단계에서 자동화 수준이 낮아 도메인 전문가의 개입이 필요하고, LTN의 연산 복잡도가 로그 규모가 커질수록 증가한다는 점을 들었다. 향후 연구 방향으로는 자동 규칙 학습(예: 강화학습 기반 규칙 발견)과 경량화된 신경‑심볼릭 엔진 개발, 그리고 규칙 충돌 해결을 위한 메타‑논리 기법 도입을 제시한다. 결론적으로, 이 연구는 LTN을 활용한 신경‑심볼릭 프레임워크가 PPM에 도메인 규칙을 효과적으로 주입함으로써 예측 정확도와 컴플라이언스 모두를 향상시킬 수 있음을 실증적으로 보여준다. 이는 규정이 엄격히 요구되는 의료·금융·제조 등 다양한 산업 분야에 적용 가능성을 시사한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기