LLM을 활용한 개인 맞춤 치료 설계 최적화 프레임워크
초록
본 논문은 환자별 유전·환경 정보를 조건으로 하는 치료 설계 문제를 블랙‑박스 최적화로 정의하고, 의료 교과서·지식 그래프 등 도메인 지식을 사전(prior)으로 활용하는 LLM 기반 엔트로피‑가이드 최적화 방법인 LEON을 제안한다. LLM을 “프롬프트‑by‑프롬프트” 방식의 확률적 설계 생성 엔진으로 사용하고, 1‑Wasserstein 거리와 ∼‑코스 그레인드 엔트로피 제약을 통해 설계 공간의 외삽을 억제한다. 실험 결과, 5개의 실제 치료 설계 태스크에서 기존 전통적 및 LLM 기반 베이스라인보다 평균 순위 1.2를 달성하며, 환자 프라이버시를 보존하면서 높은 품질의 개인화 치료안을 제시한다.
상세 분석
LEON은 개인 맞춤 의학을 조건부 블랙‑박스 최적화 문제로 수식화한다. 여기서 설계 변수 x는 가능한 치료 조합(약물, 용량, 시점 등)을, 조건 변수 z는 환자의 유전체·임상 프로파일을 의미한다. 실제 목표 함수 f(x;z)는 임상 결과(예: 생존율, 부작용 점수)이며, 직접 측정이 불가능하므로 대리 함수 ˆf(x;z)만 이용한다. 기존 대리 모델은 훈련 데이터와 실제 환자 집단 사이의 분포 차이(OOD) 때문에 신뢰도가 낮다. LEON은 두 가지 핵심 아이디어로 이를 보완한다. 첫째, 의료 교과서·PubMed·지식 그래프 등에서 추출한 도메인 지식을 LLM에 프롬프트로 제공해 “지식‑우선” 설계 후보를 생성한다. LLM은 비결정적이므로 동일 프롬프트에 대해 다수의 샘플을 얻어 출력 분포의 엔트로피를 측정한다. 낮은 엔트로피(즉, 고정된 답변) 영역은 LLM이 높은 확신을 갖는 설계이며, 이는 후보의 신뢰도 지표로 활용된다. 둘째, 설계 후보 집합 q(x)에 대해 두 제약을 부과한다. (1) 1‑Wasserstein 거리 제약: 소스 데이터 D_src(실제 임상에서 보고된 치료 기록)와 q(x) 사이의 거리 ≤ W₀을 강제해 과도한 외삽을 방지한다. 이를 위해 소스‑크리틱 c를 학습시켜, c(x)가 높은 값이면 D_src에서 온 가능성이 높다고 판단한다. (2) ∼‑코스 그레인드 엔트로피 제약: 입력 공간 X에 정의된 동치 관계 ∼에 따라 설계들을 등가 클래스
댓글 및 학술 토론
Loading comments...
의견 남기기