CRPS 기반 목표형 순차 설계와 화학 공간 적용
초록
본 논문은 가우시안 프로세스(GP) 모델의 목표 구간(임계값 이상 영역) 내 정확도를 높이기 위해, 가중치가 부여된 연속 순위 확률 점수(CRPS)를 새로운 획득 함수의 기반으로 활용한다. 점별 기준과 전체 영역을 고려한 SUR 기준을 각각 유도하고, 이를 화학 데이터셋(Photoswitch)에서 분자 탐색에 적용해 기존 방법보다 효율적인 순차 설계 성능을 입증한다.
상세 분석
이 연구는 “목표형 순차 설계(targeted sequential design)”라는 문제 설정에서 출발한다. 즉, 전체 입력 공간 X가 아니라 사전에 정의된 임계값 t에 대한 초과 영역 Γ={x∈X | f(x)≥t}에 대한 예측 정확도를 최우선으로 향상시키고자 한다. 기존 GP 기반 탐색 방법은 주로 전역 최적화(EI, UCB) 혹은 평균 제곱오차 최소화(TMSE, TIMSE) 등에 초점을 맞추었으나, 이러한 목표는 종종 목표 구간 내부의 미세한 구조를 놓치게 만든다.
논문은 이를 보완하기 위해 가중치가 부여된 CRPS(threshold‑weighted CRPS)를 도입한다. CRPS는 예측 분포와 실제 관측값 사이의 거리 기반 점수로, 낮을수록 좋은 예측을 의미한다. 여기서 가중치 측도 γ는 두 가지 형태를 사용한다. 첫 번째는 Γ에 대한 지시 함수(Indicator)로, 초과 영역에 속하는 예측에 더 큰 벌점을 부여한다. 두 번째는 평균 t를 중심으로 하는 가우시안 커널로, 임계값 근처의 예측을 강조한다. 이렇게 정의된 가중 CRPS는 예상값을 취해 현재 GP 사후분포에 대해 닫힌 형태로 계산될 수 있다.
점별 획득 함수 Gₙ(x)=E
댓글 및 학술 토론
Loading comments...
의견 남기기