불완전 로그를 위한 추론 기반 컴플라이언스 검증

불완전 로그를 위한 추론 기반 컴플라이언스 검증
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 이벤트 로그의 누락·불완전성을 논리적 귀납(Abduction) 기법으로 보완하고, 기존의 ‘강한 컴플라이언스’ 개념을 ‘조건부 컴플라이언스’와 구분하여 정의한다. SCIFF 프레임워크를 활용해 프로세스 모델과 부분 로그를 형식화하고, 세 가지 차원의 불완전성을 체계적으로 분류·처리한다. 실험 결과는 제안 방법이 실용적이며 계산 효율성을 갖춘다는 것을 보여준다.

상세 분석

이 논문은 프로세스 마이닝 분야에서 가장 난제 중 하나인 불완전 이벤트 로그의 컴플라이언스 평가 문제를 형식 논리와 귀납적 추론을 통해 해결하고자 한다. 먼저 저자들은 로그 불완전성을 ‘로그 차원(L)’, ‘트레이스 차원(T)’, ‘이벤트 기술 차원(E)’이라는 세 축으로 정의하고, 각각이 완전·불완전 상태를 가질 수 있음을 보여준다. 이러한 분류는 기존 연구가 주로 전체 로그를 전처리하거나 히스토리 기반 복구에 의존하던 점과 달리, 불완전성 자체를 정량·정성적으로 파악할 수 있는 기반을 제공한다.

핵심 기법은 SCIFF(Structured Communication and Interaction Framework for Futures)라는 논리 프로그래밍 기반 귀납 시스템이다. SCIFF은 ‘always’, ‘never’, ‘possibly’ 관측 가능성을 프로세스 모델에 메타데이터 형태로 부여함으로써, 로그에 나타나지 않을 수 있는 활동을 명시적으로 구분한다. 이를 통해 ‘never observable’ 활동은 가설(abducible)로 취급되어 자동으로 보완될 수 있고, ‘always observable’ 활동은 로그에 반드시 존재해야 하는 제약으로 작용한다. 이러한 메타정보는 프로세스 모델링 단계에서 비즈니스 분석가가 직접 지정할 수 있어, 실제 조직의 IT 시스템 특성을 모델에 반영한다는 점에서 실용성이 높다.

논문은 기존의 ‘강한 컴플라이언스(strong compliance)’ 정의를 재검토한다. 강한 컴플라이언스는 로그가 완전한 경우에만 성립하는데, 이는 불완전 로그에서는 지나치게 제한적이다. 저자들은 ‘조건부 컴플라이언스(conditional compliance)’라는 새로운 개념을 도입한다. 조건부 컴플라이언스는 현재 관측된 부분 로그에 대해, 가능한 가설 집합(시간 순서, 누락된 활동 등)을 통해 완전한 실행 경로를 복원할 수 있으면 성립한다. 이때 가설은 유일하지 않을 수 있으며, 여러 가능한 완전 경로가 존재할 경우 모두 조건부 컴플라이언스로 인정한다. 반대로 복원 불가능한 경우는 ‘비컴플라이언스(non‑compliance)’로 분류한다.

기술적 구현 측면에서 저자들은 BPMN 기반의 구조적 프로세스 모델을 논리식으로 인코딩하고, 로그의 각 이벤트를 SCIFF의 사실(fact)으로 변환한다. 이후 SCIFF의 ‘abductive proof procedure’를 실행해 가설 집합을 탐색한다. 이 과정에서 시간 제약(선후 관계)과 상호 배제 제약(예: 서로 배타적인 분기)의 일관성을 검증한다. 실험에서는 합성 로그와 실제 기업 로그 두 가지 시나리오를 사용했으며, 로그 불완전성 수준을 단계별로 증가시켜 알고리즘의 정확도와 실행 시간을 측정했다. 결과는 로그가 30% 정도 누락돼도 강한·조건부·비컴플라이언스를 정확히 구분해내며, 평균 실행 시간은 수초 수준에 머물러 실시간 분석에도 적용 가능함을 보여준다.

이 논문의 주요 기여는 다음과 같다. 첫째, 로그 불완전성을 체계적으로 분류하고, 이를 형식 논리와 귀납적 추론으로 다루는 통합 프레임워크를 제시한다. 둘째, ‘always/never/possibly’ 메타데이터를 통해 관측 가능성 정보를 모델에 직접 삽입함으로써, 실제 시스템의 로깅 특성을 정밀히 반영한다. 셋째, 강한·조건부·비컴플라이언스라는 세 단계의 컴플라이언스 개념을 정의하고, SCIFF 기반 자동 판정 절차를 제공한다. 마지막으로, 실험을 통해 제안 방법이 이론적 완전성(완전·완전성 보장)과 실용적 효율성(시간 복잡도) 모두를 만족함을 입증한다. 이러한 접근은 프로세스 마이닝 도구가 불완전 로그에 대해 보다 유연하고 신뢰성 있게 컴플라이언스를 평가하도록 하는 중요한 전환점이 될 것으로 기대된다.


댓글 및 학술 토론

Loading comments...

의견 남기기