마코프 의사결정으로 비용 효율적인 치료 규칙 자동 학습

본 논문은 환자·피고인 등 대상의 특성을 입력으로 최적 치료·판단을 내리는 해석 가능한 의사결정 리스트를 학습한다. 기대 효과를 극대화하고, 진단·치료 비용을 최소화하도록 설계된 목적 함수를 정의하고, 이를 마코프 결정 과정(MDP)으로 모델링한다. 탐색은 UCT(Upper Confidence Bound for Trees) 기반의 트리 탐색 알고리즘에 맞춤형 가지치기 규칙을 적용해 효율적으로 수행한다. 실제 보석 보석·천식 치료 데이터에 적용해…

저자: Himabindu Lakkaraju, Cynthia Rudin

**1. 서론** 논문은 의료·법률 등 고위험 의사결정 상황에서 인간 전문가가 직관·경험에 의존해 결정을 내리는 한계를 지적한다. 실제 의사·판사는 진단·검사 비용, 치료·판결 비용, 그리고 기대 효과를 동시에 고려해야 하지만, 기존 데이터‑기반 자동화 방법은 이러한 다중 목표를 통합하지 못한다. 따라서 저자는 **비용‑효과적이며 해석 가능한 치료(판단) 규칙**을 자동으로 학습하는 프레임워크를 제안한다. **2. 관련 연구** 치료 규칙 학습은 크게 **회귀 기반**(조건부 기대값 추정 후 최적 치료 선택)와 **정책 탐색 기반**(정책 클래스 내 최적화)으로 나뉜다. 대부분은 결과 예측에만 초점을 맞추고 비용·해석성을 무시한다. 동적 치료(regime) 연구는 시계열·다단계 의사결정에 초점을 두지만, 해석성·비용 고려가 부족하다. 또한, 해석 가능한 모델(결정 리스트·세트·프로토타입 등)은 예측에 활용되었으나 치료 효과와 비용을 동시에 최적화하는 데는 적용되지 않았다. **3. 문제 정의 및 모델링** - **데이터**: D = {(x_i, a_i, y_i)}_{i=1}^N, 여기서 x_i는 p 차원 특성, a_i는 실제 할당 치료, y_i는 관측 결과(높을수록 좋음). - **비용 함수**: d(f) → 특성 f의 평가 비용, d′(a) → 치료 a의 비용. - **치료 규칙**: 결정 리스트 π =

마코프 의사결정으로 비용 효율적인 치료 규칙 자동 학습

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기