일반 위험 제어를 위한 선택적 예측 SCoRE 프레임워크

SCoRE는 사전 학습된 모델에 대해 연속형 위험을 제한하면서 선택적으로 예측을 수행하도록 설계된 새로운 프레임워크이다. 교환가능성을 이용해 위험‑조정 e‑값을 구성하고, 이를 가설 검정 절차에 연결해 한정된 샘플에서도 MDR(전체 위험)과 SDR(선택적 평균 위험)을 정확히 제어한다. 실험은 약물 발견, 임상 예측, 대형 언어 모델 등 다양한 분야에서 효율성을 입증한다.

저자: Tian Bai, Ying Jin

본 논문은 인공지능 모델을 실제 환경에 배포할 때, 예측이 불확실한 경우에 abstain(거부) 옵션을 제공하는 선택적 예측(selective prediction) 문제를 연속형 위험으로 확장한다. 기존 연구는 주로 이진 오류(예: 0‑1 손실)만을 다루었으며, 위험 제어를 위해 대규모 샘플에 대한 균일 집중(uniform concentration) 가정을 필요로 했다. 저자들은 이러한 한계를 극복하고자, 사전 학습된 블랙박스 모델 f와 별도로 학습된 스코어 함수 s를 이용해 위험을 추정하고, 교환가능성(exchangeability)만을 가정하는 새로운 프레임워크 SCoRE(Selective Conformal Risk control with E-values)를 제안한다. SCoRE는 두 가지 위험 제어 지표를 정의한다. 첫 번째는 Marginal Deployment Risk(MDR)로, 배포된 인스턴스 전체에 대한 기대 위험 E

일반 위험 제어를 위한 선택적 예측 SCoRE 프레임워크

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기