암 연구 영국 약물 발견 프로세스 마이닝
초록
본 논문은 CRUK의 약물 발견 유닛이 Dotmatics에 저장한 이벤트 로그를 활용해 프로세스 마이닝을 수행하고, Disco와 ProM 도구를 비교·적용함으로써 업무 흐름을 시각화하고 효율성을 진단한다. 결과는 관리자는 Disco로, 연구자는 ProM으로 접근할 것을 제안한다.
상세 분석
본 연구는 Cancer Research UK (CRUK) 약물 발견 유닛(Drug Discovery Unit, DDU)의 실험실 데이터베이스인 Dotmatics에 축적된 이벤트 로그를 원천 데이터로 삼아 프로세스 마이닝을 시도한다. 이벤트 로그는 실험 단계, 담당자, 타임스탬프 등으로 구성되어 있으나, 기존에는 단순 저장·조회 용도로만 활용돼 왔다. 논문은 먼저 로그 추출 과정을 상세히 기술한다. 데이터베이스 스키마를 분석하고, ‘case id’(실험 프로젝트), ‘activity’(실험 단계), ‘timestamp’, ‘resource’(연구원) 필드를 매핑하여 XES 형식으로 변환한다. 변환 과정에서 누락된 이벤트와 중복 기록을 정제하고, 시간 간격이 비정상적으로 큰 레코드를 필터링하는 전처리 절차를 제시한다.
전처리된 로그를 바탕으로 두 가지 주요 프로세스 마이닝 툴, Disco와 ProM을 적용한다. Disco는 GUI 기반으로 비전문가도 손쉽게 흐름 다이어그램을 생성하고, 빈도와 평균 소요 시간을 시각화한다. 이를 통해 DDU 내에서 가장 빈번히 발생하는 실험 단계(예: ‘화합물 합성’, ‘생물학적 스크리닝’)와 병목 현상(예: ‘데이터 정제’ 단계에서 평균 대기 시간 48시간 초과)을 식별한다. 반면 ProM은 플러그인 구조를 활용해 알파 알고리즘, 히든 마르코프 모델, 퍼포먼스 마이닝 등 고급 분석을 수행한다. 특히, 알파 알고리즘을 통해 실제 실행된 프로세스 모델을 재구성하고, 퍼포먼스 마이닝으로 각 활동의 리드 타임과 변동성을 정량화한다. 결과는 Disco가 직관적인 경영 보고에 적합한 반면, ProM은 학술적 검증과 세부적인 프로세스 개선 방안 도출에 유리함을 보여준다.
또한 논문은 프로세스 마이닝이 일회성 프로젝트가 아니라 지속적인 운영 관리 도구임을 강조한다. 로그 품질 관리, 정기적인 모델 업데이트, 그리고 모델 결과를 실제 업무 정책에 반영하는 피드백 루프 구축이 필요하다고 제언한다. 마지막으로, 이벤트 로그 자체가 조직 행동과 비즈니스 프로세스를 이해하는 핵심 자산이며, 로그 설계 단계부터 목적에 맞는 데이터 포인트를 포함시키는 것이 성공적인 마이닝의 전제라는 교훈을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기