24시간 오존 피크 예측을 위한 신경망 분류기와 기상 예보 활용

프랑스 중부 오를레앙 지역의 시간별 최대 오존 농도를 24시간 앞서 예측하기 위해, 기상예보(MOS) 데이터를 입력으로 하는 다층 퍼셉트론(MLP) 기반 신경망에 시그모이드 출력층을 추가한 신경분류기를 도입하였다. BIC 기반 가중치 정규화와 신뢰구간 계산을 적용해 과적합을 방지했으며, 2003년 여름 검증 결과 성공지수(Success Index)가 78%에 달해 기존 MLP(65‑72%)보다 우수함을 확인했다.

저자: A. Dutot (LISA), Joseph Rynkiewicz (CES, Samos)

24시간 오존 피크 예측을 위한 신경망 분류기와 기상 예보 활용
본 논문은 프랑스 중부 오를레앙 도시권에서 시간별 최대 오존 농도를 24시간 앞서 예측하기 위한 실시간 모델을 개발하고, 그 성능을 상세히 평가한다. 연구 배경으로는 대기오염 관리 의무와 기존 3차원 화학‑전달 모델의 높은 연산 비용 및 복잡성을 들며, 통계‑기계학습 기반 접근법의 필요성을 제시한다. 데이터는 1999‑2003년 5년간 수집된 오존 관측치와 프랑스 기상청이 제공하는 MOS(모델 출력 통계) 자료를 사용한다. MOS는 구름량(6등급), 강수량(10등급), 풍속·풍향(각각 6·8등급), 최대·최소 기온, 0‑300 m 수직 온도 구배 등 5가지 기상 요소를 3시간·12시간 간격으로 제공한다. 이 중 3시간 간격으로는 구름·강수·풍향·풍속을, 12시간 간격으로는 기온과 온도 구배를 이용해 각 클래스의 시간 빈도를 계산하였다. 총 74개의 기상 변수와 전일 12 UTC 시점 오존 농도(지속성)를 입력으로 사용한다. 입력 변수 선택은 BIC‑유사 기준을 적용한 단계별 회귀(REGRESS) 절차를 통해 수행되었다. ANOVA 검증으로 학습(1999‑2002)과 검증(2003) 데이터 간 차이가 없음을 확인한 뒤, 변수 선택 결과 8개의 핵심 변수가 남았다: 전일 오존 농도, D+1 최소·최대 기온, 평균 풍속, 풍향 빈도(동·남동·남·남서·서), 그리고 ‘구름 없음’ 빈도. 신경망 구조는 NARX 형태의 다층 퍼셉트론(MLP)이며, 은닉층에 단일 뉴런을 두고 하이퍼볼릭 탄젠트 활성함수를 사용한다. 과적합 방지를 위해 BIC 기준에 따라 가중치 프루닝을 수행했으며, 초기 가중치는 동일 입력을 갖는 선형 회귀 해로 설정하였다. 학습은 Levenberg‑Marquardt 2차 최적화 방법으로 진행되었고, 입력 데이터는 평균·표준편차로 정규화하였다. 예측 성능을 향상시키기 위해 출력층에 시그모이드 함수를 적용한 신경분류기를 도입하였다. 이 모델은 출력값을 0‑1 사이의 확률로 해석해 오존 임계값(180 µg m⁻³) 초과 가능성을 직접 제공한다. 기존 MLP는 연속값을 예측하고 사후 임계값 판정을 하는 반면, 신경분류기는 분류 목적에 최적화되어 성공지수(Success Index, SI)를 78%까지 끌어올렸다. 비교 대상으로는 로지스틱 회귀와 기존 MLP(성공지수 65‑72%)가 있었으며, 신경분류기가 명확히 우수했다. 검증 결과는 2003년 여름 데이터에 기반한다. 실제 초과 사건은 7건이었으며, 모델은 6건을 정확히 탐지했다(재현율 86%). 전체 데이터 중 초과 사건 비중이 2% 미만으로 매우 희소했기 때문에, Nunnari 등(2004)의 데이터 균형화 기법을 적용해 저농도 사례를 인위적으로 감소시켰다. 이를 통해 모델이 고농도 패턴에 더 민감하게 학습하도록 조정하였다. 또한, CHIMERE라는 3차원 화학‑전달 모델과 다중선형 회귀 모델(LIN)과도 비교하였다. CHIMERE는 D+1 예보에서 평균 절대오차(MAE)와 RMSE가 15 µg m⁻³, 평균 편차(MBE) 5 µg m⁻³를 기록했으며, Agreement Index는 92%에 달했다. 신경분류기 기반 NEUROZONE는 이와 동등하거나 약간 우수한 성능을 보이며, 실시간 운영에 필요한 계산량이 현저히 낮다. 운용 측면에서 NEUROZONE 시스템은 매년 9월 말에 최신 데이터를 추가해 재학습하고, 매일 12 UTC에 다음 날(24 h) 오존 초과 확률을 실시간으로 제공한다. 소프트웨어는 오픈소스 LINUX/SOLARIS 환경에서 동작하는 REGRESS와 Windows 기반 Visual Basic 프로그램으로 구성되어 있다. 결론적으로, 기상 MOS 데이터를 활용한 경량 신경망‑분류기 조합은 도시 대기오염 관리에 필요한 빠른 예보와 높은 정확도를 동시에 제공한다. BIC 기반 정규화와 신뢰구간 계산을 통해 모델의 일반화 능력을 확보했으며, 데이터 불균형 문제를 해결하기 위한 균형화 전략도 효과적이었다. 향후 연구에서는 상층 대기 흐름과 태양복사량을 추가 변수로 포함하고, 다중 지역에 대한 확장 검증을 수행함으로써 모델의 범용성을 높일 수 있을 것으로 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기