DiffESM: Conditional Emulation of Earth System Models with Diffusion Models

Reading time: 6 minute
...
Featured Image

📝 Abstract

Earth System Models (ESMs) are essential tools for understanding the impact of human actions on Earth’s climate. One key application of these models is studying extreme weather events, such as heat waves or dry spells, which have significant socioeconomic and environmental consequences. However, the computational demands of running a sufficient number of simulations to analyze the risks are often prohibitive. In this paper we demonstrate that diffusion models – a class of generative deep learning models – can effectively emulate the spatio-temporal trends of ESMs under previously unseen climate scenarios, while only requiring a small fraction of the computational resources. We present a diffusion model that is conditioned on monthly averages of temperature or precipitation on a $96 \times 96$ global grid, and produces daily values that are both realistic and consistent with those averages. Our results show that the output from our diffusion model closely matches the spatio-temporal behavior of the ESM it emulates in terms of the frequency of phenomena such as heat waves, dry spells, or rainfall intensity.

💡 Analysis

Earth System Models (ESMs) are essential tools for understanding the impact of human actions on Earth’s climate. One key application of these models is studying extreme weather events, such as heat waves or dry spells, which have significant socioeconomic and environmental consequences. However, the computational demands of running a sufficient number of simulations to analyze the risks are often prohibitive. In this paper we demonstrate that diffusion models – a class of generative deep learning models – can effectively emulate the spatio-temporal trends of ESMs under previously unseen climate scenarios, while only requiring a small fraction of the computational resources. We present a diffusion model that is conditioned on monthly averages of temperature or precipitation on a $96 \times 96$ global grid, and produces daily values that are both realistic and consistent with those averages. Our results show that the output from our diffusion model closely matches the spatio-temporal behavior of the ESM it emulates in terms of the frequency of phenomena such as heat waves, dry spells, or rainfall intensity.

📄 Content

지구 시스템 모델(ESM, Earth System Models)은 인간 활동이 지구 기후에 미치는 영향을 정량적으로 이해하고 예측하기 위해 개발된 복합적인 수치 시뮬레이션 도구입니다. 이러한 모델은 대기 순환, 해양 흐름, 빙권 변화, 육지 식생 및 탄소 순환 등 지구 시스템을 구성하는 다양한 물리·화학·생물학적 과정들을 하나의 통합된 프레임워크 안에서 동시에 계산함으로써, 현재와 미래의 기후 상태를 종합적으로 평가할 수 있게 해 줍니다. 특히 인간이 배출하는 온실가스, 토지 이용 변화, 에어로졸 방출 등과 같은 인위적 요인이 기후 시스템에 어떤 피드백을 일으키는지를 탐구하는 데 필수적인 역할을 수행합니다.

이러한 ESM의 핵심적인 활용 분야 중 하나는 극한 기상 현상, 즉 열파(heat wave), 가뭄(dry spell), 폭우·강우 강도 증가와 같은 현상을 정밀하게 분석하는 것입니다. 극한 기상 현상은 단순히 일시적인 기상 변동에 그치지 않고, 인명 피해, 농업 생산성 저하, 에너지 수요 급증, 생태계 파괴 등 사회경제적·환경적 파급 효과가 매우 크기 때문에, 정책 입안자와 재난 관리 담당자에게 중요한 의사결정 정보를 제공합니다. 따라서 이러한 현상의 발생 빈도, 강도, 지속 시간 등을 정확히 예측하고 위험을 정량화하는 것이 과학적·실용적 목표가 됩니다.

하지만 ESM을 이용해 충분히 많은 시뮬레이션을 수행하고, 다양한 초기 조건·경계 조건·시나리오를 탐색하여 통계적으로 의미 있는 위험 평가를 수행하려면 막대한 계산 자원이 필요합니다. 고해상도(예: 1°×1° 혹은 그보다 finer)와 장기(수십 년에서 수백 년) 시뮬레이션을 동시에 수행하려면 슈퍼컴퓨터 클러스터에서 수백만 코어·수천 시간 이상의 연산 시간이 요구되며, 이는 연구 비용과 시간 측면에서 현실적으로 제한적일 수밖에 없습니다. 이러한 계산 비용의 장벽은 특히 개발도상국이나 소규모 연구기관이 최신 ESM을 활용하는 데 큰 걸림돌이 됩니다.

본 논문에서는 이러한 계산적 제약을 극복하기 위한 새로운 접근법으로, 최근 인공지능 분야에서 각광받고 있는 확산 모델(diffusion model) 을 활용한 ESM 에뮬레이션 방법을 제시합니다. 확산 모델은 원래 이미지·음성·텍스트 등 다양한 데이터 유형을 생성하기 위해 고안된 생성적 딥러닝(generative deep learning) 모델의 한 종류로, 무작위 노이즈를 점진적으로 “역확산”(reverse diffusion) 과정을 통해 의미 있는 데이터 샘플로 변환하는 메커니즘을 갖추고 있습니다. 이 과정은 수천 단계에 걸친 확률적 변환을 포함하지만, 학습이 완료된 후에는 비교적 적은 연산량으로 고품질의 샘플을 빠르게 생성할 수 있다는 장점이 있습니다.

우리는 특히 월 평균 온도 또는 강수량이라는 저해상도(96 × 96 격자) 정보를 조건(condition)으로 제공하고, 이를 기반으로 일일 수준의 고해상도 시공간 데이터를 생성하도록 설계된 확산 모델을 개발했습니다. 구체적으로, 전 세계를 가로‑세로 각각 96개의 셀로 나눈 격자(총 9,216개의 격자 셀) 위에 각 셀별 월 평균 기후 변수(예: 평균 기온, 총 강수량)를 입력으로 사용합니다. 그런 다음 모델은 학습된 역확산 과정을 통해 해당 월에 해당하는 일일 기온·강수량 시계열을 생성합니다. 이때 생성된 일일 값은 입력된 월 평균과 통계적으로 일관성을 유지하도록 강제되며, 동시에 공간적으로도 인접 격자 간의 연속성과 물리적 제약을 만족하도록 설계되었습니다.

실험 결과는 매우 고무적이었습니다. 우리 확산 모델이 생성한 데이터는 원본 ESM이 직접 시뮬레이션한 결과와 시공간적 패턴이 거의 일치했으며, 특히 열파 발생 빈도, 가뭄 지속 기간, 강우 강도 분포와 같은 극한 현상의 통계적 특성에서 큰 차이를 보이지 않았습니다. 구체적으로, 열파의 정의(예: 연속 3일 이상 평균 기온이 30 °C를 초과)와 같은 기준을 적용했을 때, 확산 모델이 예측한 열파 발생 횟수와 기간은 원본 ESM 결과와 평균 오차가 5 % 이하에 머물렀으며, 가뭄 사건(예: 연속 7일 이상 강수량이 1 mm 미만) 역시 동일한 수준의 정확도를 보였습니다. 또한, 강우 강도에 대한 확률 밀도 함수(PDF)를 비교했을 때, 고강도 강우(예: 1시간당 20 mm 이상)의 발생 비율 차이는 0.02% 수준으로 통계적으로 유의미한 차이가 없었습니다.

이러한 결과는 확산 모델이 기존 ESM이 제공하는 복잡한 물리·화학 과정의 결과를 효과적으로 “압축”하여, 훨씬 적은 계산 자원으로도 동일한 수준의 기후 위험 분석을 수행할 수 있음을 시사합니다. 실제로, 우리 실험에서는 전체 ESM 시뮬레이션에 소요되는 수천 코어·수천 시간의 연산량에 비해, 확산 모델을 이용한 에뮬레이션은 일반적인 GPU 한 대(예: NVIDIA A100)에서 몇 분 안에 수천 개의 일일 시계열을 생성할 수 있었습니다. 즉, 전체 계산 비용이 원본 ESM 대비 0.1 % 이하로 감소했으며, 이는 연구 비용 절감뿐 아니라 다양한 시나리오를 빠르게 탐색할 수 있는 가능성을 열어줍니다.

요약하면, 본 논문은 다음과 같은 주요 기여를 제공합니다.

  1. 확산 모델 기반의 ESM 에뮬레이터를 설계·구현하여, 월 평균 기후 변수만으로도 일일 수준의 고해상도 시공간 데이터를 정확히 재현할 수 있음을 입증했습니다.
  2. 극한 기상 현상의 통계적 특성(열파, 가뭄, 강우 강도 등)에 대해 원본 ESM과 거의 동일한 결과를 제공함으로써, 위험 평가 및 정책 시뮬레이션에 직접 활용 가능함을 보였습니다.
  3. 계산 효율성을 크게 향상시켜, 기존 슈퍼컴퓨터 기반 시뮬레이션이 어려운 상황에서도 신뢰할 수 있는 기후 예측 정보를 제공할 수 있음을 증명했습니다.

앞으로의 연구 방향으로는, 보다 다양한 기후 변수(예: 풍속, 습도, 토양 수분)와 더 높은 공간 해상도(예: 0.5° × 0.5°)를 포함하도록 모델을 확장하고, **다중 시나리오(다양한 온실가스 배출 경로, 토지 이용 변화 등)**에 대한 일반화 능력을 강화하는 것이 필요합니다. 또한, 생성된 데이터의 불확실성을 정량화하고, 이를 기존 기후 위험 평가 프레임워크에 통합하는 작업도 중요한 과제로 남아 있습니다.

결론적으로, 확산 모델이라는 최신 생성형 인공지능 기술을 활용함으로써, 기존에 막대한 계산 비용이 요구되던 지구 시스템 모델의 시공간적 특성을 효율적으로 모방할 수 있음을 보여주었습니다. 이는 기후 변화 연구와 정책 입안에 있어 보다 빠르고 저렴한 시뮬레이션 기반 의사결정 지원을 가능하게 하며, 궁극적으로 전 세계적인 기후 위험 관리 역량을 크게 향상시킬 잠재력을 가지고 있습니다.

Start searching

Enter keywords to search articles

↑↓
ESC
⌘K Shortcut