지진 발생 수의 통계분포와 분기 과정
초록
본 논문은 지진 발생을 ‘출생·이민’ 인구 과정으로 모델링하고, 이 모델이 포아송, 기하, 로그, 그리고 음이항(NBD) 분포를 어떻게 유도하는지를 설명한다. NBD는 두 파라미터를 갖으며, 두 번째 파라미터는 군집화와 과산포(over‑dispersion)를 정량화한다. 저자는 다양한 지역·전세계 카탈로그와 시간·공간 구간별로 NBD 파라미터와 불확실성을 추정하고, 지진 예측 및 카탈로그 분석에 NBD를 적용하는 장단점을 논의한다.
상세 분석
이 연구는 지진 발생을 확률적 분기 과정, 즉 ‘출생·이민(birth‑immigration)’ 모델로 정의한다. 기본 가정은 일정한 비율의 독립적인 ‘이민자’ 사건이 지속적으로 발생하고, 각 사건이 일정 확률로 후속 사건(자식)을 생성한다는 것이다. 이 과정은 규모(또는 로그 모멘텀) 축을 따라 연속적인 분기를 형성하며, 결과적으로 규모‑빈도 관계와 시간·공간 윈도우 내 사건 수의 통계적 특성을 동시에 설명한다.
수학적으로는 포아송 과정에 감마 분포를 혼합한 형태가 음이항 분포(NBD)로 귀결된다. 포아송 파라미터 λ는 평균 사건 수를, 감마 파라미터(k, θ)는 사건 간 군집화 정도를 나타낸다. k가 무한대로 커지면 감마 혼합이 사라져 순수 포아송이 되고, k가 1이면 기하 분포가, k가 0에 가까우면 로그 분포가 된다. 따라서 NBD는 포아송·기하·로그·음이항 네 가지 이산 분포를 하나의 일반화된 틀 안에 포함한다는 점이 핵심이다.
논문은 NBD 파라미터가 카탈로그 완전성(magnitude of completeness)과 직접 연관됨을 실증적으로 보여준다. 완전성 임계값을 높이면 관측 가능한 작은 사건이 사라면서 군집화 파라미터 k가 감소하고, 이는 과산포가 더 뚜렷해짐을 의미한다. 또한, 시간 창을 확대하거나 공간 영역을 확대하면 평균 사건 수 λ가 증가하지만, k는 지역별 지진활동성(예: 변환대 vs. 수렴대)이나 텍스처에 따라 차이를 보인다.
통계적 추정 방법으로는 최대우도법과 베이지안 사후분포를 활용했으며, 파라미터 불확실성은 피셔 정보 행렬과 부트스트랩 재표본을 통해 정량화하였다. 저자는 NBD의 두 표현—파스칼(음이항) 형태와 포아송‑감마 혼합 형태—의 장단점을 비교한다. 파스칼 형태는 직접적인 확률 질량 함수를 제공해 데이터 적합도 검정에 유리하지만, 파라미터 간 상관관계가 강해 추정이 불안정할 수 있다. 반면 포아송‑감마 혼합은 베이지안 프레임워크와 자연스럽게 연결돼 사전분포 설정이 용이하고, 군집화 정도를 직관적으로 해석할 수 있다.
실제 카탈로그 적용 사례에서는 일본·캘리포니아·전세계(USGS) 데이터에 대해 0.51.0 년, 10 km·10 km, 5°·5° 등 다양한 윈도우를 설정해 파라미터 추정값을 제시한다. 결과는 대부분의 경우 k가 0.20.8 사이에 머물며, 포아송 모델( k→∞ )보다 과산포를 명확히 설명한다는 점을 확인한다. 또한, 지진 예측 모델(예: CSEP)에서 사건 수의 사전분포로 NBD를 채택하면 신뢰구간이 넓어져 과소평가 위험을 감소시키지만, 파라미터 변동성이 큰 경우 예측 불확실성이 급증한다는 한계도 지적한다.
결론적으로, NBD는 지진 발생의 군집화 특성을 정량화하고, 카탈로그 완전성·시간·공간 스케일에 따른 변화를 일관되게 설명하는 강력한 통계 도구이며, 기존 포아송 기반 접근법을 보완하거나 대체할 수 있는 실용적·이론적 기반을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기