다중모달 빙하호 범람 예측 데이터셋 GLOFNet
GLOFNet은 카라코람 지역 Shisper 빙하를 대상으로 Sentinel‑2 영상, NASA ITS_LIVE 빙하 속도, MODIS 지표면 온도 20년치를 통합한 다중모달 데이터셋이다. 구름 마스킹·품질 필터링·정규화·시간 보간·데이터 증강·주기적 인코딩 등 정교한 전처리를 거쳐 각 모달리티를 정렬하였다. 탐색적 분석 결과, 계절별 빙하 속도 변동, 연
초록
GLOFNet은 카라코람 지역 Shisper 빙하를 대상으로 Sentinel‑2 영상, NASA ITS_LIVE 빙하 속도, MODIS 지표면 온도 20년치를 통합한 다중모달 데이터셋이다. 구름 마스킹·품질 필터링·정규화·시간 보간·데이터 증강·주기적 인코딩 등 정교한 전처리를 거쳐 각 모달리티를 정렬하였다. 탐색적 분석 결과, 계절별 빙하 속도 변동, 연간 평균 온도 상승(~0.8 K/10년), 공간적 빙하·수온 이질성이 확인되었다. GLOFNet은 희귀 재해인 GLOF 예측을 위한 클래스 불균형·구름 오염·저해상도 문제를 해결하고, 멀티모달 딥러닝 벤치마크용 공개 데이터로 제공된다.
상세 요약
본 논문은 빙하호 범람(GLOF) 예측에 필요한 데이터가 기존에 파편화되고 단일 모달리티에 머물러 있다는 근본적인 한계를 지적한다. 이를 극복하기 위해 저자들은 Sentinel‑2의 10 m 다중스펙트럼 이미지, NASA ITS_LIVE에서 제공하는 일일 빙하 변위·속도, 그리고 MODIS의 1 km 지표면 온도(LST) 시계열을 동일 지역·시간 축에 맞추어 통합하였다. 전처리 단계에서는 Sentinel‑2의 구름 마스크(SCL)와 QA 밴드를 활용해 구름·그림자 픽셀을 제거하고, ITS_LIVE의 품질 플래그를 기준으로 잡음이 큰 관측을 배제하였다. 정규화는 각 밴드·속도·온도에 대해 0‑1 스케일링을 적용했으며, 시간 간격이 불규칙한 ITS_LIVE와 MODIS 데이터는 선형 보간과 스플라인 보간을 혼합해 일일 간격으로 재구성하였다. 데이터 증강은 시공간적 변동성을 보강하기 위해 랜덤 회전·플립·색상 변형을 적용했고, 계절성을 반영하기 위해 월·일 정보를 사이클릭 인코딩(예: sin(2π·day/365)) 형태로 추가하였다. 모달리티 간 정렬은 동일 픽셀 좌표와 동일 타임스탬프를 기준으로 3차원 텐서(시간 × 채널 × 공간) 형태로 결합함으로써 멀티모달 신경망이 직접적인 피처 융합을 수행할 수 있게 설계되었다. 탐색적 분석에서는 ITS_LIVE 속도가 겨울에 감소하고 여름에 급증하는 계절 주기를 보이며, 이는 온도 상승과 빙하 용융량 증가와 높은 상관관계를 나타낸다. MODIS LST는 지난 20년간 평균 0.8 K/10년의 온난화를 기록했으며, 고도에 따라 온도 구배가 다르게 나타나 공간적 이질성을 강조한다. 이러한 통계적 인사이트는 GLOF 위험이 특정 시점·위치에 집중될 가능성을 시사한다. 데이터셋은 클래스 불균형(폭발 사건이 극히 드뭄) 문제를 완화하기 위해 오버샘플링·가중 손실 함수를 제안하고, 구름 오염을 최소화한 고품질 이미지만을 제공한다. 또한, Sentinel‑2의 10 m 해상도와 MODIS의 1 km 해상도 차이를 보정하기 위해 다중스케일 피처 피라미드를 도입, 저해상도 온도 정보를 고해상도 영상에 매핑하는 방법을 제시한다. 최종적으로 GLOFNet은 공개 저장소에 메타데이터와 함께 제공되며, 멀티모달 딥러닝 모델(예: ConvLSTM, Transformer‑Fusion) 및 전통적 시계열 모델(ARIMA, Random Forest) 모두에 적용 가능한 벤치마크를 제공한다. 이는 GLOF 예측 연구의 재현성·비교 가능성을 크게 향상시킬 것으로 기대된다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...