규칙 기반 간호사 스케줄링을 위한 지능형 지역 탐색을 결합한 분포 추정 알고리즘

본 논문은 간호사 스케줄링에 적용되는 규칙 기반 할당 방식을 명시적 학습으로 전환하는 새로운 메메틱 진화 알고리즘을 제안한다. 기본 프레임워크는 확률 분포를 추정하는 EDA(Estimation of Distribution Algorithm)이며, 각 세대에서 생성된 해에 대해 안트-마이너(Ant‑Miner) 기반 지역 탐색이 수행되어 해를 개선한다. 기존

규칙 기반 간호사 스케줄링을 위한 지능형 지역 탐색을 결합한 분포 추정 알고리즘

초록

본 논문은 간호사 스케줄링에 적용되는 규칙 기반 할당 방식을 명시적 학습으로 전환하는 새로운 메메틱 진화 알고리즘을 제안한다. 기본 프레임워크는 확률 분포를 추정하는 EDA(Estimation of Distribution Algorithm)이며, 각 세대에서 생성된 해에 대해 안트-마이너(Ant‑Miner) 기반 지역 탐색이 수행되어 해를 개선한다. 기존 연구와 달리 학습이 암묵적이 아닌 명시적으로 이루어져, 유용한 빌딩 블록인 간호사‑규칙 쌍을 직접 식별할 수 있다. 전체 접근법은 간호사‑규칙 쌍의 발생 확률을 모델링함으로써 스케줄을 구성하고, 안트‑마이너는 높은 보상을 받은 쌍을 강화한다. 실제 복잡한 병원 환경의 간호사 로스터링 문제에 적용한 실험 결과, 제안 방법이 기존 대부분의 기법보다 우수한 성능을 보였다. 이러한 학습 메커니즘은 규칙에 따라 체계적으로 스케줄을 생성하는 다른 분야에도 적용 가능할 것으로 기대된다.

상세 요약

이 논문은 규칙 기반 스케줄링이라는 특수한 도메인에 EDA와 메메틱(지역 탐색) 기법을 결합함으로써 두 가지 중요한 연구 질문에 답한다. 첫 번째는 “규칙‑간호사 매칭을 어떻게 확률 모델로 표현하고 학습할 것인가”이며, 두 번째는 “학습된 모델을 활용해 실제 로스터링 문제에 적용했을 때 성능 향상을 어떻게 입증할 것인가”이다. 기존의 규칙 기반 로스터링 연구는 주로 휴리스틱 규칙을 고정된 순서로 적용하거나, 규칙 선택을 무작위 혹은 단순한 적합도 기반 선택에 의존했다. 이러한 접근은 규칙 간의 상호작용을 고려하지 못해, 복잡한 제약(연속 근무 제한, 휴식 요구, 선호도 등)이 얽힌 실제 병원 환경에서 최적해에 도달하기 어려웠다.

본 연구는 EDA를 사용해 “간호사‑규칙 쌍”이라는 원자적 단위를 확률적으로 모델링한다. 구체적으로, 각 세대에서 현재 인구의 통계적 특성을 기반으로 확률 분포를 업데이트하고, 이 분포로부터 새로운 해를 샘플링한다. 이렇게 하면 탐색 공간 전체에 대한 전역적인 정보를 유지하면서도, 특정 규칙이 특정 간호사에게 자주 선택되는 패턴을 자동으로 포착한다.

그 위에 삽입된 안트‑마이너 지역 탐색은 전통적인 메타휴리스틱인 Ant Colony Optimization의 강화 학습 메커니즘을 차용한다. 각 해에 대해 규칙‑간호사 매칭에 보상을 할당하고, 보상이 높은 매칭에 페로몬을 강화함으로써 다음 세대에서 해당 매칭이 더 높은 확률로 선택되도록 유도한다. 이 과정은 “명시적 학습”이라 부를 수 있는데, 왜냐하면 학습 결과가 확률 분포라는 형태로 직접 드러나며, 연구자는 어떤 빌딩 블록이 효과적인지 해석 가능하기 때문이다.

실험에서는 실제 병원에서 수집한 복잡한 로스터링 인스턴스를 사용했으며, 비교 대상으로는 전통적인 제약 기반 스케줄링, 기존 메타휴리스틱(GA, SA, Tabu Search) 및 이전 연구에서 제시한 암묵적 학습 EDA를 포함했다. 결과는 제안된 메메틱 EDA가 평균 비용, 최적도 도달 속도, 그리고 제약 위반 횟수 측면에서 대부분의 비교 알고리즘을 앞섰음을 보여준다. 특히, 안트‑마이너가 삽입된 후 초기 몇 세대에서 급격히 비용이 감소하는 현상이 관찰되었는데, 이는 지역 탐색이 전역 탐색을 효과적으로 보완한다는 증거이다.

이 논문의 의의는 두 가지이다. 첫째, 규칙 기반 스케줄링 문제에 확률 모델을 적용함으로써 “규칙‑간호사”라는 구조적 정보를 명시적으로 학습할 수 있게 한 점이다. 둘째, 메메틱 프레임워크를 통해 전역 탐색(EDA)과 지역 탐색(안트‑마이너)을 자연스럽게 결합함으로써 탐색 효율성을 크게 향상시켰다는 점이다. 이러한 접근은 규칙 집합이 사전에 정의되고, 스케줄이 규칙 순서에 따라 순차적으로 구성되는 다른 도메인(예: 생산 라인 배치, 교통 신호 스케줄링)에도 확장 가능성이 크다. 앞으로는 페로몬 강화 메커니즘을 더 정교화하거나, 다중 목표(근무 만족도, 비용, 공정성) 최적화를 위한 다중 분포 모델링을 도입하는 연구가 기대된다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...