환자 변이성을 고려한 전이 학습: 숨은 파라미터 마코프 결정 과정의 개선

본 논문은 기존 HiP‑MDP 모델이 상태 불확실성과 잠재 파라미터 불확실성을 독립적으로 취급해 전이 학습에 비현실적인 요구를 하는 문제를 지적하고, 이를 Gaussian Process Latent Variable Model(GPLVM)로 통합한 새로운 HiP‑MDP 프레임워크를 제안한다. 제안 모델은 환자별 생리적 차이를 저차원 잠재 공간에 효율적으로 매핑하고, 제한된 데이터만으로도 HIV 치료 정책을 빠르게 개인화한다. 실험 결과, 기존 “…

저자: Taylor Killian, George Konidaris, Finale Doshi-Velez

본 논문은 환자 간 생리적 변이성을 고려한 전이 학습 문제를 다루며, 기존 Hidden Parameter Markov Decision Process(HiP‑MDP) 모델의 근본적인 한계를 지적한다. 원 HiP‑MDP는 각 작업 인스턴스를 잠재 파라미터 w 로 완전히 설명한다는 가정 하에, 전이 확률 T(s′|s,a,w) 를 학습한다. 그러나 파라미터 가중치 w 와 베이스 함수 f 을 독립적으로 추정하도록 설계돼, 파라미터 필터 z 를 정확히 파악하려면 상태 공간 S 전체를 탐색해야 한다. 로봇과 같이 자유롭게 위치를 조정할 수 있는 시스템에서는 가능하지만, 인간 환자에게는 비현실적이다. 이를 해결하기 위해 저자들은 Gaussian Process Latent Variable Model(GPLVM)을 도입해 w 와 상태 s 를 하나의 확장 상태 ŝ=

환자 변이성을 고려한 전이 학습: 숨은 파라미터 마코프 결정 과정의 개선

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기