오션포캐스트벤치 데이터 기반 글로벌 해양 예측 벤치마크
초록
본 논문은 28년간의 전 세계 해양 재분석 자료와 위성·관측 데이터를 결합한 공개 벤치마크 OceanForecastBench를 제안한다. 4개의 해양 변수와 23개의 수심 레벨, 4개의 해표면 변수를 포함한 학습용 데이터셋과 약 1억 개 관측 지점을 담은 평가용 데이터셋을 제공하며, 6개의 대표 모델을 이용한 평가 파이프라인을 공개한다. 이를 통해 데이터‑드리븐 해양 예측 모델의 재현성·비교 가능성을 크게 향상시킨다.
상세 분석
OceanForecastBench는 현재 데이터‑드리븐 해양 예측 연구에서 가장 포괄적인 벤치마크로 평가된다. 첫째, 학습 데이터는 CMEMS의 GLORYS12 재분석을 기반으로 1993‑2021년 28년간 전 세계 해양을 0.083°(≈8 km) 해상도로 제공한다. 여기에는 수온, 염분, 동서·남북 흐름(총 4 변수)과 50개의 수심 레벨이 포함되며, 평균 동역학 지형(MDT)까지 제공해 해수면 높이(SLA) 변환을 지원한다. 둘째, ERA5와 OSTIA를 각각 해수면 풍과 해수면 온도( SST) 변수로 추가해, 표면 강제와 열 교환을 모델이 학습할 수 있도록 설계했다. 데이터 용량은 GLORYS12만 13 TB에 달하지만, GPU 메모리와 연산 제한을 고려해 최종 학습용 해상도를 1.40625°(≈150 km)와 23개의 수심 레벨로 다운샘플링하였다. 이는 정보 손실을 최소화하면서도 대부분의 연구기관이 접근 가능한 규모이다.
평가 데이터는 EN4(관측 기반 수온·염분), Global Drifter Program(GDP, SST·표면 흐름), CMEMS L3(해수면 높이) 등 3가지 주요 출처를 통합해 약 5.7 × 10¹⁰ 바이트(57 GB) 규모로 구축하였다. 특히 EN4는 1900‑2025년까지의 고품질 Argo 부표 데이터를 포함해, 장기적인 모델 검증에 적합하다. 관측 데이터는 품질 플래그를 기반으로 필터링하고, 시·공간 정렬을 위한 정밀 보간 과정을 거쳐 모델 출력과 직접 비교할 수 있도록 전처리된다.
베이스라인으로는 전통적인 수치예보 시스템(NWP)과 최신 딥러닝 모델(예: Swin‑Transformer 변형, ConvLSTM, U‑Net 기반 변형 등) 6종을 선정했다. 각 모델은 동일한 학습·검증 분할(1993‑2017년 학습, 2018‑2020년 검증)과 동일한 손실 함수(MSE, MAE) 하에 훈련되었으며, 평가 지표는 RMSE, ACC, SSIM 등 다중 차원을 포함한다. 실험 결과, 딥러닝 모델은 단기(1‑3 일) 예측에서 전통 모델 대비 평균 15 % 이상의 RMSE 감소를 보였지만, 장기(30 일 이상)에서는 여전히 편향과 누적 오차가 크게 나타났다. 또한, 수심별 성능 차이가 두드러져, 얕은 수층(0‑100 m)에서는 높은 정확도를 유지했으나 깊은 수층(>500 m)에서는 데이터 희소성과 물리적 복잡성으로 인해 성능이 급격히 저하되었다.
이 벤치마크는 데이터 표준화, 평가 파이프라인 자동화, 그리고 오픈소스 코드 제공을 통해 연구자 간 재현성을 크게 향상시킨다. 특히, 다중 변수·다중 수심을 동시에 다루는 통합 입력 포맷은 기존 단일 변수·단일 레벨 접근법보다 더 현실적인 해양 시스템을 모델링할 수 있게 한다. 향후 연구는 (1) 고해상도 지역 모델과의 하이브리드, (2) 물리 기반 제약을 포함한 물리‑학습 결합 모델, (3) 관측 데이터의 불확실성을 정량화하는 베이지안 접근법 등을 탐색할 여지를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기