일일 연안 저산소 예측을 위한 인공지능 모델 성능 비교 연구
초록
본 논문은 루이지애나‑텍사스 해안에서 발생하는 저산소 현상을 일일 단위로 예측하기 위해, BiLSTM, Medformer, ST‑Transformer, TCN 네 가지 딥러닝 아키텍처를 동일한 데이터 전처리·입출력·검증 절차 하에 비교한다. 2009‑2020년 12년간의 COAWST 해양‑생물지구화학 모델 힌드캐스트 데이터를 학습에, 2020‑2024년 데이터를 테스트에 사용했으며, 수층 안정성, 퇴적물 산소소모, 온도 의존 분해율 등 세 가지 핵심 변수를 입력으로 활용한다. 모든 모델이 높은 정확도와 AUC‑ROC(0.982‑0.992)를 기록했으나, ST‑Transformer가 전반적인 지표에서 가장 우수하였다. 또한 McNemar 검정을 통해 모델 간 예측 차이가 통계적으로 유의함을 확인하였다. 연구는 재현 가능한 코드와 프레임워크를 공개함으로써 실시간 운영 예보 시스템 구축에 기여한다.
상세 분석
이 연구는 연안 저산소 현상의 일일 예보라는 실용적 요구에 딥러닝 기반 시계열 분류 모델을 적용한 최초 사례 중 하나로 평가된다. 데이터는 COAWST(ROMS‑NEMURO) 결합 모델에서 추출한 5년(2009‑2020) 여름 기간(5~8월) 일일 격자 데이터를 25 km² 해상도로 구성했으며, 총 1 471개의 여름 샘플을 포함한다. 입력 변수는 수층 안정성을 나타내는 잠재에너지 이상(Potential Energy Anomaly, PEA), 퇴적물 산소소모율(SOC), 온도 의존 분해율(DCPTemp) 등 저산소 발생 메커니즘을 직접 반영하는 세 가지 물리·생화학 변수를 선택했다.
전처리 단계에서는 시간 주기성을 보존하기 위해 일·월·시간을 사인·코사인 변환으로 사이클릭 인코딩하고, 최소‑최대 정규화와 육지 마스크 적용을 수행했다. 시퀀스 생성은 7일 윈도우를 슬라이딩하여 3차원 텐서(샘플 × 시간 × 특징) 형태로 변환했으며, 저산소 사건이 희귀한 점을 고려해 SMOTE 기반 오버샘플링과 가중 랜덤 배치를 병행해 클래스 불균형을 완화하였다.
모델 설계는 네 가지 최신 시계열 아키텍처를 포괄한다. BiLSTM은 전·후향 LSTM을 120개의 유닛 두 층으로 구성해 양방향 시간 의존성을 포착한다. TCN은 3층의 팽창(dilated) 1‑D 컨볼루션으로 인과성을 유지하면서 병렬 연산 효율성을 확보한다. Medformer는 다중 스케일 패치 분해와 로컬·글로벌 어텐션을 결합해 변수 간 복합 상호작용을 학습한다. ST‑Transformer는 공간(그리드 셀)과 시간 차원을 동시에 어텐션하는 16개의 헤드와 3개의 인코더 층을 사용해, 공간적 패턴과 시간적 변화를 통합적으로 모델링한다. 모든 모델은 동일한 학습률, 배치 크기, 조기 종료 기준을 적용했으며, 5‑fold 교차 검증과 연도별 독립 테스트를 통해 일반화 성능을 평가했다.
성능 지표는 정확도, F1‑score, AUC‑ROC를 사용했으며, 특히 운영 환경에서 중요한 F1‑score(클래스 불균형 고려)와 AUC‑ROC(순위 구분력)에서 ST‑Transformer가 0.992에 달하는 최고값을 기록했다. 다른 모델도 0.98 수준의 AUC를 보였지만, McNemar 검정 결과 ST‑Transformer와 TCN, Medformer 사이에 통계적으로 유의한 차이가 존재함을 확인했다. 이는 공간‑시간 어텐션 구조가 저산소 현상의 복합 요인을 더 효과적으로 학습한다는 점을 시사한다.
한계점으로는 데이터가 여름 기간에 국한돼 계절 외 변동성을 충분히 반영하지 못했으며, SMOTE 기반 오버샘플링이 시계열 연속성을 인위적으로 변형할 위험이 있다. 또한 모델 해석성을 강화하기 위한 SHAP·Grad‑CAM 등 설명 기법이 적용되지 않아, 예보 담당자가 물리적 메커니즘과 모델 출력 사이의 인과 관계를 직관적으로 파악하기 어렵다. 향후 연구에서는 전년도 포함한 연중 데이터를 확대하고, 물리‑기반 제약을 결합한 하이브리드 모델을 탐색하며, 모델 설명성을 강화하는 방법을 모색할 필요가 있다.
전반적으로 이 논문은 동일한 데이터 파이프라인 하에 네 가지 최신 딥러닝 시계열 모델을 체계적으로 비교하고, 운영 수준의 일일 저산소 예보 가능성을 실증함으로써 해양 환경 AI 연구에 중요한 벤치마크를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기