LSTM으로 예측하는 비즈니스 프로세스 모니터링
본 논문은 LSTM 기반 모델을 활용해 다음 활동, 타임스탬프, 전체 진행 경로 및 남은 처리 시간을 예측함으로써 기존 맞춤형 방법보다 일관된 높은 정확도를 달성한다는 것을 실증한다.
저자: Niek Tax, Ilya Verenich, Marcello La Rosa
본 논문은 비즈니스 프로세스 모니터링 분야에서 예측 모델의 범용성과 데이터 의존성을 해결하기 위해 LSTM(Long Short‑Term Memory) 신경망을 활용한 통합 접근법을 제시한다. 기존 연구들은 특정 예측 과제(다음 활동, 남은 시간, 결과 등)에 특화된 모델을 개발했으며, 데이터셋마다 성능 차이가 크고 하이퍼파라미터 튜닝에 많은 비용이 소요되는 한계를 가지고 있었다. 이러한 문제점을 인식한 저자들은 LSTM이 자연어 처리와 음성 인식 등 다양한 시퀀스 모델링 분야에서 일관된 높은 정확도를 보인다는 점에 착안하여, 비즈니스 프로세스 로그에도 동일한 원리를 적용하고자 했다.
논문은 크게 세 부분으로 구성된다. 첫 번째 부분에서는 “다음 활동 및 타임스탬프 예측”을 다룬다. 이벤트 로그의 각 이벤트를 원‑핫 인코딩된 활동 벡터와 세 가지 시간 기반 피처(이전 이벤트와의 시간 차이, 하루 내 시간, 주간 시간)로 변환하고, 이를 순차 입력으로 LSTM에 공급한다. LSTM은 두 개의 출력 레이어를 통해 (1) 다음 활동의 확률 분포를, (2) 다음 이벤트까지의 시간 차이를 동시에 예측한다. 멀티태스크 학습 구조를 채택함으로써 활동 예측과 시간 예측 사이의 상호 보완적 정보를 공유하고, 모델의 일반화 능력을 향상시킨다. 또한, 공유 레이어와 전용 레이어를 조합한 하이브리드 구조를 실험하여 모델 복잡도와 성능 사이의 최적 균형을 탐색한다.
두 번째 부분에서는 “전체 진행 경로(Continuation) 예측”을 제시한다. 학습된 다음 활동 예측 모델을 재귀적으로 적용해 현재까지 관측된 prefix에 가장 확률이 높은 다음 활동을 선택하고, 해당 활동의 예상 타임스탬프를 이용해 새로운 prefix를 만든다. 이 과정을 케이스가 종료될 때까지 반복함으로써 전체 시퀀스를 예측한다. 기존 연구에서는 전이 시스템, 그래프 기반 최단 경로 탐색, 마크오프 체인 등을 사용했지만, 이러한 방법들은 복잡한 프로세스 구조나 비정형 흐름에 취약했다. LSTM 기반 접근법은 시계열 패턴을 직접 학습하므로, 복잡한 의존 관계와 비선형 흐름을 자연스럽게 모델링할 수 있다.
세 번째 부분에서는 “남은 사이클 타임 예측”을 다룬다. 전체 진행 경로 예측 결과를 활용해 남은 시간을 계산한다. 구체적으로는 예측된 전체 시퀀스의 마지막 이벤트 타임스탬프와 현재 시점 사이의 차이를 남은 시간으로 정의한다. 이는 별도의 회귀 모델을 구축하는 전통적 방법에 비해 데이터 전처리 비용이 적고, LSTM이 학습한 시계열 정보를 직접 활용함으로써 더 일관된 정확도를 제공한다.
실험은 네 개의 실제 이벤트 로그(예: 의료 진료 프로세스, 물류 운송, 은행 대출 처리 등)에서 수행되었다. 각 로그에 대해 여러 예측 시점(초기, 중간, 후기)에서 기존 최첨단 방법(전이 시스템 기반, 마크오프 체인, 비선형 회귀, 랜덤 포레스트 등)과 비교하였다. 평가 지표는 다음 활동 예측의 Top‑1 정확도와 남은 시간 예측의 평균 절대 오차(MAE)이다. 결과는 LSTM 기반 모델이 모든 과제와 시점에서 평균 5~12% 높은 정확도와 더 낮은 변동성을 보였으며, 특히 데이터가 희소하거나 프로세스 흐름이 비정형적인 경우에도 안정적인 성능을 유지함을 보여준다.
논문의 주요 기여는 다음과 같다. 첫째, LSTM을 활용해 비즈니스 프로세스 로그의 순차적 특성을 효과적으로 포착하고, 다중 예측 과제를 하나의 통합 프레임워크로 해결한다. 둘째, 멀티태스크 학습과 하이브리드 레이어 구조를 통해 활동 예측과 시간 예측 사이의 상호 보완성을 극대화한다. 셋째, 전체 진행 경로 예측을 기반으로 남은 사이클 타임을 추정함으로써 별도 회귀 모델이 필요 없는 간결한 솔루션을 제공한다. 마지막으로, 다양한 실제 로그와 예측 시점에 걸친 포괄적인 실험을 통해 제안 방법의 일반화 가능성을 실증하였다.
결론적으로, 이 연구는 LSTM 기반 모델이 비즈니스 프로세스 모니터링 분야에서 기존 맞춤형 방법을 대체하거나 보완할 수 있는 강력하고 범용적인 도구임을 입증한다. 향후 연구에서는 사례 결과를 활용한 실시간 의사결정 지원, 리소스 할당 최적화, 그리고 사례 결과 예측(예: 성공/실패) 등으로 확장할 여지가 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기