콜롬비아 갈등 분석을 위한 초거리 파동 회귀와 계층적 클러스터링
초록
본 논문은 시간 순서 제약 계층적 군집화를 이용해 다변량 시계열 데이터의 계층 구조를 추출하고, 이를 초거리 파동(wavelet) 회귀와 결합해 외부 신호와의 연관성을 분석한다. 1990‑2004년 콜롬비아 내 폭력 사건 데이터를 사례로 삼아, 계층적 변화를 파악하고 미국 마약 시장 지표와의 상관성을 탐색한다.
상세 분석
이 연구는 “계층이 변화 분석에 적합한 도구”라는 가설을 실증적으로 검증한다. 먼저 시간 순서 제약을 부여한 계층적 군집화(시간연속성 제약 HAC)를 적용해, 연도별 폭력 사건의 다변량 특성(사망자 수, 사건 유형, 지역 분포 등)을 군집화한다. 이 과정에서 사용된 거리 측정은 유클리드 거리와 동적 시간 왜곡(DTW)을 혼합한 가중합이며, 군집 수는 실루엣 점수와 정보 기준(AIC/BIC)으로 최적화한다. 결과적으로 1990‑1995, 1996‑1999, 2000‑2004의 세 개 주요 시기(또는 서브클러스터)로 구분되며, 각 시기는 폭력 강도와 지역적 집중도가 뚜렷하게 차이난다.
다음 단계는 초거리 파동 회귀이다. 전통적인 웨이브릿 변환은 시계열을 다중 해상도로 분해해 고주파(단기 변동)와 저주파(장기 추세)를 구분한다. 저자들은 계층적 군집 결과를 “계층적 인덱스”라는 새로운 설명 변수로 정의하고, 이를 파동 회귀 모델에 포함시킨다. 구체적으로, 각 군집에 대한 평균 시계열을 웨이브릿 변환한 뒤, 해당 계층 인덱스를 회귀 계수의 가중치로 활용한다. 이렇게 하면 군집 간 구조적 차이가 파동 계수에 직접 반영되어, 외부 신호(예: 미국 마약 가격, 석유 가격 등)와의 동시 변동을 보다 정밀하게 포착할 수 있다.
실증 분석에서는 미국의 마약 시장 지표(헤로인 가격, 코카인 수출량 등)와 콜롬비아 폭력 데이터 간의 상관성을 검증한다. 파동 회귀 결과, 저주파 성분에서는 마약 가격 상승이 폭력 사건 증가와 양의 상관관계를 보였으며, 고주파 성분에서는 특정 연도(1998년, 2002년)의 급격한 가격 변동이 폭력 급증에 선행한다는 시그널을 포착한다. 이는 마약 시장의 가격 변동이 장기적인 갈등 구조에 영향을 미치고, 단기적인 가격 충격이 폭력 폭발을 촉발할 수 있음을 시사한다.
또한, 모델의 예측 성능을 기존 ARIMA, VAR, 그리고 단순 웨이브릿 회귀와 비교했을 때, 계층적 파동 회귀가 평균 제곱 오차(MSE)와 AIC 모두에서 우수함을 확인했다. 이는 계층 정보를 활용한 모델이 시계열의 비선형성 및 구조적 전이를 더 효과적으로 포착한다는 증거이다.
연구의 한계로는 데이터의 공간적 해상도가 제한적이며, 군집화 단계에서 선택한 거리 함수와 군집 수가 결과에 민감하게 작용한다는 점을 들 수 있다. 향후 연구에서는 지리적 가중치를 포함한 공간‑시간 계층 모델을 도입하고, 비선형 회귀(예: Gaussian Process)와 결합해 보다 정교한 인과 메커니즘을 밝히는 것이 제안된다.
댓글 및 학술 토론
Loading comments...
의견 남기기