확률적 컴퓨터 모델 전역 민감도 분석을 위한 공동 메타모델 접근법
초록
본 논문은 불확실한 입력 변수들이 stochastic(확률적) 컴퓨터 모델의 출력 변동성에 미치는 영향을 정량화하기 위한 전역 민감도 분석 방법을 제안한다. 기존 deterministic 모델에만 적용되던 방법을 확장하여, 제어 불가능한 변수에 의해 발생하는 이질분산(heteroscedastic) 데이터를 동시에 모델링하는 joint metamodel을 도입한다. 평균과 분산을 각각 Generalized Additive Models(GAM)와 Gaussian Process(GP)로 비모수적으로 추정하고, 이를 통해 Sobol‑type 민감도 지수를 계산한다. 두 개의 사례 연구에서 제안 방법이 이질분산이 명확히 존재할 때에도 정확한 민감도 지수를 제공함을 입증한다.
상세 분석
이 논문은 stochastic computer model, 즉 입력 변수 외에 내재된 무작위 요인(예: 난수 시드, 환경 변동)으로 인해 동일 입력에 대해 서로 다른 출력이 발생하는 모델을 대상으로 전역 민감도 분석(Global Sensitivity Analysis, GSA)을 수행하는 새로운 프레임워크를 제시한다. 핵심 아이디어는 출력 데이터를 평균(mean)과 분산(dispersion) 두 부분으로 분리하여 동시에 추정하는 joint modeling 접근법이다. 평균 부분은 전통적인 메타모델링 기법인 Gaussian Process(GP) 혹은 Generalized Additive Model(GAM)으로, 분산 부분은 이질분산을 허용하는 GAM 기반의 분산 모델링으로 각각 구축한다. 이렇게 하면 입력 변수들이 평균에 미치는 일차 효과와, 동시에 분산(불확실성) 자체에 미치는 영향을 별도로 파악할 수 있다.
논문은 먼저 heteroscedastic 데이터에 대한 통계적 배경을 정리하고, joint metamodel이 기존의 단일 메타모델(평균만 모델링)보다 왜 더 효율적인지를 이론적으로 설명한다. 특히, Sobol 지수의 정의를 확장하여 total variance를 평균 변동과 분산 변동으로 분해하고, 각각에 대한 1차 및 고차 상호작용 효과를 계산한다. 이를 위해 Monte‑Carlo 샘플링과 재표본화(resampling) 기법을 결합해 추정 편향을 최소화한다.
실험에서는 (1) 이차원 함수에 인위적으로 이질분산을 부여한 합성 사례와 (2) 실제 공정 시뮬레이션인 열교환기 설계 문제를 적용한다. 두 경우 모두 joint metamodel이 기존 GP 기반 GSA에 비해 평균·분산 예측 정확도가 현저히 높으며, 특히 분산이 입력에 따라 크게 변하는 구간에서 Sobol 지수의 추정 오차가 크게 감소한다는 결과를 보여준다. 또한, 모델 복잡도와 계산 비용을 고려한 교차 검증 결과, GAM‑GP 혼합 모델이 가장 좋은 성능을 보이며, 완전 GP 기반 모델은 이질분산을 제대로 포착하지 못함을 확인한다.
이러한 결과는 stochastic 모델에서 불확실성 원인을 정확히 구분하고, 설계·운영 단계에서 위험 관리와 자원 배분에 실질적인 의사결정 지원을 제공할 수 있음을 시사한다.
댓글 및 학술 토론
Loading comments...
의견 남기기