날씨 역확산으로 제로샷 대기 모델링
초록
WIND는 대기 데이터를 비디오 시퀀스로 보고, 독립적인 노이즈 레벨을 적용한 확산 강제 학습으로 사전학습된 단일 기반 모델이다. 사후 샘플링과 순간 일치(MMPS) 기법을 이용해 예보, 고해상도 다운스케일링, 희소 재구성, 물리 보존 등 다양한 기후·날씨 과제를 별도 파인튜닝 없이 역문제로 정의해 해결한다. 실험에서 14일 확률 예보, 공간·시간 다운스케일링, 장기 롤아웃 안정성 등에서 기존 autoregressive 모델을 능가한다.
상세 분석
본 논문은 대기 과학 분야에서 최근 부상하고 있는 ‘기초 모델(foundation model)’ 개념을 확산 기반 비디오 생성 모델에 적용한 최초 사례 중 하나로 평가할 수 있다. 기존의 대기 AI 모델들은 특정 과제(예: 강수 예측, 풍속 예보 등)에 맞춰 별도 학습·파인튜닝이 필요했으며, 이는 데이터·연산 비용을 크게 증가시켰다. WIND는 이러한 파편화를 근본적으로 해소하고자, ‘자기 지도(self‑supervised) 비디오 복원’이라는 목표 아래 대규모 ERA5 데이터를 이용해 사전학습을 수행한다. 핵심 아이디어는 각 프레임에 독립적인 노이즈 레벨 σ_k 를 무작위로 부여하고, 모델이 어떤 조합의 깨끗한 프레임과 노이즈 프레임이 주어지더라도 전체 시퀀스를 복원하도록 학습시키는 ‘diffusion forcing’ 방식이다. 이 접근법은 (1) 기존 전체 시퀀스 확산 모델이 요구하는 동일 노이즈 스케줄의 제약을 없애고, (2) 이전 윈도우의 깨끗한 프레임을 컨텍스트로 자유롭게 사용할 수 있게 하여 롤링 롤아웃 시 발생하는 분포 이동 문제를 해결한다.
학습 단계에서 모델은 노이즈 레벨 정보를 입력으로 받지 않으며, 오직 노이즈가 섞인 시퀀스 Z 로부터 원본 X 를 추정한다. 이는 모델이 내부적으로 노이즈 수준을 추정하도록 강제함으로써, 불확실성 추정 능력을 자연스럽게 함양한다. 점수 기반 모델(s_θ) 은 denoising score matching을 통해 ∇_Z log p(Z) 를 근사한다.
추론 단계에서는 다양한 기후·날씨 과제를 ‘역문제(inverse problem)’로 공식화한다. 관측 Y = A(X) + η 형태의 선형·비선형 연산자 A 를 정의하고, 사전 확산 모델이 제공하는 prior score와 관측에 기반한 likelihood score 를 결합한다. 여기서 likelihood score 는 Moment Matching Posterior Sampling(MMPS) 기법을 이용해 근사한다. MMPS는 관측 제약을 만족시키는 동시에 사전 분포의 다변량 구조를 보존하도록 설계돼, 기존의 point‑estimate 기반 posterior sampling보다 더 안정적이고 물리적으로 일관된 샘플을 생성한다.
구체적인 과제 정의는 다음과 같다. (1) 확률 예보: A=identity, 즉 제약 없이 미래 프레임을 샘플링한다. (2) 공간 다운스케일링: A는 평균 풀링(AvgPool) 연산으로, 저해상도 입력으로부터 고해상도 상태를 복원한다. (3) 시간 다운스케일링: 일일 평균을 이용해 sub‑daily 변동성을 재구성한다. (4) 희소 재구성: 센서 마스크 M 을 적용해 관측되지 않은 영역을 채운다. (5) 물리 보존: 건조 공기 질량 보존 등 전역적인 제약을 강제한다. (6) 반사실(counterfactual) 시나리오: 평균 기온 상승 등 특정 채널에 대한 평균 변화를 강제한다.
실험 결과는 네 가지 주요 측면에서 기존 최첨단 autoregressive 모델(AR‑UVIT 등) 대비 우수함을 보여준다. 첫째, 14일 확률 예보에서 CRPS(Continuous Ranked Probability Score)가 3~5일 이후부터 지속적으로 낮아져, 장기 예보 안정성이 크게 향상된다. 둘째, Spread‑Skill Ratio(SSR) 분석에서 초기 과신(over‑confidence) 단계가 빠르게 1에 수렴, 즉 불확실성 추정이 정확해짐을 확인한다. 셋째, 20년 연속 롤아웃 실험에서 AR‑UVIT이 고주파 성분에서 비물리적 스파이크를 보이는 반면, WIND는 스펙트럼 전반에 걸쳐 물리적 일관성을 유지한다. 넷째, 공간 다운스케일링(4배 해상도 향상) 과제에서 Fourier Neural Operator(FNO)와 UVIT 기반 모델을 능가하는 PSNR 및 SSIM을 기록한다.
또한, 물리 보존 제약을 적용했을 때 예보 정확도에 거의 영향을 주지 않으며, 오히려 물리적 신뢰성을 높이는 효과가 있다. 반사실 스토리라인 실험에서는 2°C 온난화 시나리오 하에서 강수 강도와 이동 경로가 물리적으로 일관된 변화를 보이며, 정책·위험 평가에 활용 가능한 ‘가상 기후 사건’ 생성이 가능함을 시연한다.
한계점으로는 현재 1.5° 저해상도(≈121×240) 데이터를 사용해 학습·평가했으며, 고해상도(0.25°) 실시간 운영에 대한 직접적인 검증은 부족하다. 또한, 노이즈 레벨을 명시적으로 입력받지 않음으로써 매우 높은 노이즈 상황에서의 복원 성능이 제한될 수 있다. 향후 연구에서는 멀티스케일 아키텍처와 고해상도 재학습, 그리고 비선형 물리 제약(예: 에너지 보존, 대류‑강수 상호작용) 통합을 통해 실용성을 높일 여지가 있다.
전반적으로 WIND는 ‘사전 학습된 대기 사전분포’를 제공하고, 다양한 기후·날씨 과제를 사후 샘플링 단계에서 물리적·통계적 제약과 결합함으로써, 별도 파인튜닝 없이도 다목적 활용이 가능한 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기