지진 발생 수 전체 분포 예측이 더 공정하고 강건하다
초록
본 연구는 지진 발생 수의 평균만을 예측하는 기존 방식보다, 각 시공간‑규모 구간에서 발생 가능한 지진 수의 전체 확률분포를 예측하는 것이 통계적으로 우수하고, 대형 지진이나 군집 현상이 발생했을 때도 모델 성능이 크게 저하되지 않음을 입증한다. 합성 데이터와 캘리포니아 실제 데이터에 대해 ETAS 기반 모델을 활용한 의사‑전향 실험을 수행했으며, CSEP이 현재 채택하고 있는 포아송 가정이 실제 지진 수의 중‑중량 꼬리 특성을 제대로 반영하지 못한다는 점을 지적한다.
상세 분석
이 논문은 지진 예측 모델 평가에 사용되는 전통적인 로그우도 점수가 “예상 평균만을 제공하는 경우에만” 포아송 분포를 가정하도록 설계돼 있다는 근본적인 한계를 지적한다. 포아송 분포는 평균과 분산이 동일하다는 특성 때문에, 평균값이 실제 관측값의 최빈값과 크게 차이 나는 중‑중량(heavy‑tailed) 분포를 제대로 표현하지 못한다. 저자들은 이 문제를 해결하기 위해 ETAS(자기‑유발 점진적 시계열) 모델을 확장해, 각 시공간‑규모 셀에 대해 수천 번의 시뮬레이션을 수행해 경험적 확률분포를 추정하고, 이를 부드러운 커널 방법으로 보정한다. 이렇게 얻어진 전체 분포는 포아송 가정에 비해 로그우도 점수에서 평균 15~30% 정도의 향상을 보이며, 특히 2008년 Hector Mine(Mw 7.1), 2010년 El Mayor‑Cucapah(Mw 7.2) 등 대형 사건이 포함된 테스트 기간에서도 성능 저하가 거의 없었다.
합성 카탈로그 실험에서는 30년 훈련‑30년 테스트 구성을 20번 반복하고, 공간 해상도(10 km1000 km), 최소 진도(15), 테스트 기간(1 yr, 5 yr) 등 5 × 2 × 5 × 20 = 1000가지 조합을 탐색했다. 모든 경우에서 전체 분포를 이용한 모델(모델 1)이 평균·분산만을 이용한 포아송 모델(모델 2)보다 유의미하게 높은 점수를 기록했다. 실제 캘리포니아 데이터에서도 동일한 결과가 재현되었으며, 특히 2014년 북서부 네바다의 활발한 군집 활동 기간에도 전체 분포 기반 예측이 안정적인 점수를 유지했다.
또한, CSEP이 향후 “전체 분포와 셀 간 상관관계”를 허용하겠다는 계획을 언급하고 있지만, 현재는 포아송 가정이 강제되어 있어 ETAS와 같은 복합 모델이 본래의 예측 능력을 발휘하지 못하고 있다. 저자들은 모든 예측 모델이 평균이 아닌 전체 확률분포를 제공하도록 설계돼야 하며, 이를 통해 모델 간 공정한 비교와 실제 재난 대비에 더 유용한 정보를 얻을 수 있다고 주장한다.
이 연구는 통계 물리학적 관점(중‑중량 분포, 브랜칭 비율≈0.96)과 지진학적 실증 분석을 결합해, “예측은 평균이 아니라 전체 분포를 말해야 한다”는 강력한 논거를 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기