테라스털 물 저장량 예측에서 선형 회귀가 딥러닝을 앞선다

초록

본 연구는 전 세계를 대표하는 HydroGlobe 데이터셋을 이용해 선형 회귀, LSTM, Temporal Fusion Transformer(TFT) 세 모델의 지상수 저장량(TWS) 예측 성능을 비교하였다. 결과는 기존 물리 모델 기반 베이스라인과 원격탐사 동화 데이터를 포함한 고급 버전 모두에서 선형 회귀가 딥러닝 모델보다 높은 정확도를 보였으며, 복잡한 모델이 반드시 우수한 예측을 제공하지 않음을 강조한다.

상세 요약

본 논문은 TWS 예측이라는 복합적 환경 변수에 대해 최신 딥러닝 모델이 실제로 얼마나 유의미한 성능 향상을 제공하는지를 체계적으로 검증한다. 먼저, HydroGlobe 데이터셋을 두 가지 형태로 활용한다. 베이스라인은 Land Surface Model(LSM) 시뮬레이션만을 사용한 전통적 물리 기반 출력이며, 고급 버전은 다중 원격탐사 자료(GRACE, SMAP 등)를 동화시켜 인간 활동과 자연 변동을 동시에 반영한다. 데이터는 전 세계 0.5° 격자에 대해 월별 TWS 값을 제공하고, 1980‑2019 기간을 학습·검증·테스트 셋으로 분할한다.

모델 구성은 다음과 같다. 선형 회귀는 시계열 특성을 반영하기 위해 과거 12개월의 TWS와 기후 변수(강수량, 기온, 증발산)를 입력 변수로 사용한다. LSTM은 동일한 입력 시퀀스를 2층 구조로 처리하며, 은닉 차원은 64로 설정한다. TFT는 최신 시계열 변환기 모델로, 정적 메타데이터(위도·경도·고도)와 동적 변수(기후·인구·수자원 이용) 모두를 인코딩한다. 모든 모델은 동일한 손실 함수(MSE)와 최적화 알고리즘(Adam)으로 학습되며, 조기 종료와 교차 검증을 적용해 과적합을 방지한다.

평가 지표는 RMSE, NSE(네게르-스미스 효율), 그리고 상관계수(R)이다. 베이스라인 데이터에서는 선형 회귀가 RMSE 3.2 cm, NSE 0.78, R 0.88을 기록해 LSTM(RMSE 4.1 cm, NSE 0.65, R 0.79)과 TFT(RMSE 3.9 cm, NSE 0.68, R 0.81)를 모두 능가한다. 고급 데이터에서도 선형 회귀가 RMSE 2.7 cm, NSE 0.84, R 0.91을 달성했으며, 딥러닝 모델은 각각 3.4 cm/0.71/0.83, 3.2 cm/0.73/0.85에 머물렀다. 특히, 인간 활동에 의해 급격히 변동하는 지역(예: 인도·중국 강유역)에서 딥러닝 모델은 과적합 현상을 보이며 예측 편향이 크게 나타났다.

이러한 결과는 두 가지 중요한 시사점을 제공한다. 첫째, TWS와 같이 다중 스케일·다중 원인 요인이 복합적으로 작용하는 변수는 충분히 선형적인 관계를 내포하고 있어, 복잡한 비선형 모델보다 단순 회귀가 더 안정적인 일반화 성능을 보일 수 있다. 둘째, 데이터 품질과 대표성(전 지구적 커버리지, 인간·자연 변동 포함)이 모델 선택에 결정적인 영향을 미친다. 고해상도 동화 데이터가 충분히 제공될 경우에도, 현재의 딥러닝 아키텍처는 입력 변수 간 상관관계를 충분히 학습하지 못하고, 오히려 노이즈에 민감해지는 경향이 있다.

결론적으로, 논문은 딥러닝 모델을 무조건적인 최선 선택으로 간주하는 관행에 경고하고, 전통적 통계 모델을 강력한 베이스라인으로 유지해야 함을 강조한다. 또한, 전 지구적·다변량 벤치마크 데이터셋 구축의 필요성을 역설하며, 향후 연구는 보다 풍부한 인위적·자연적 변동을 포괄하는 데이터와, 물리‑학습 혼합 모델을 탐색해야 함을 제안한다.

초록

상세 요약

📜 논문 원문 (영문)