폭력범죄와 경제·인구 변수의 공적분 모델 자동 탐색
본 논문은 범죄 데이터와 다수의 경제·인구 지표 사이에 존재할 수 있는 공적분 관계를 자동으로 탐색하는 모델 생성기를 제안한다. Engle‑Granger 1단계 검정과 AIC·BIC 기반 순위를 이용해 186개의 후보 모델 중 15개의 공적분 모델을 식별하고, 최종적으로 비서구계 청년 남성 수와 물가조정 소비가 포함된 모델이 가장 우수함을 확인한다.
저자: J. L. van Velsen
본 논문은 폭력범죄와 경제·인구 지표 사이에 존재할 수 있는 장기적 균형 관계, 즉 공적분 관계를 자동으로 탐색하고 최적 모델을 선정하는 ‘모델 생성기’를 제안한다. 연구 배경으로는 범죄와 실업률, 청년 남성 인구, 이혼율, 소비 등 다양한 변수 간의 상관관계가 정책·예측에 중요한 의미를 갖지만, 기존 연구는 제한된 변수 집합에 대해 수동으로 모델을 검증해 왔다는 점을 지적한다.
1. **데이터와 전처리**
- 폭력범죄 데이터(강도·폭행·살인·강간·협박)와 5개의 잠재적 설명변수(실업률 x₁, 서구계 청년 남성 x₂, 비서구계 청년 남성 x₃, 이혼 건수 x₄, 물가조정 소비 x₅)를 1978년부터 2006년까지 연도별로 수집하였다.
- ADF 검정과 KPSS 검정을 통해 모든 변수는 1차 차분(I(1)) 수준임을 확인하였다. 이는 공적분 분석을 수행하기 위한 필수 전제조건이다.
2. **모델 생성기 설계**
- 후보 모델은 변수 집합 S₀={1,…,5}의 모든 비공집합(2⁵‑1=31개)과 상수·추세 포함 여부(3가지) 조합으로 총 186개가 된다.
- 각 모델에 대해 Engle‑Granger 절차의 첫 단계(φ=0 가정)로 OLS 추정 후 잔차에 대한 단위근 검정을 수행한다. 0.05 유의수준에서 단위근을 기각하지 못하면 해당 모델은 비공적분으로 간주하고 제외한다.
- 남은 모델은 비선형 최소제곱(NLS) 방법(마르쿠트 알고리즘)으로 φ를 포함한 전체 파라미터를 추정한다. 추정 정확도는 1×10⁻⁴ 이하의 오차와 최대 500회 반복으로 보장한다.
- 추정 후 Breusch‑Godfrey LM 검정(2 지연)으로 잔차의 자기상관을 검증하고, p값이 0.20 이상인 모델만을 최종 후보로 남긴다.
3. **모델 선택 및 순위 매김**
- 최종 후보 15개 모델에 대해 SSR 기반 AIC와 BIC를 계산한다. AIC=ln(SSR)+2N/n, BIC=ln(SSR)+N·ln(n)/n(여기서 N은 파라미터 수, n은 표본 크기).
- 두 정보 기준 모두에서 상위 6개 모델이 동일한 모델 집합을 구성했으며, 순서만 다르게 나타났다. 이 6개 모델은 모두 비서구계 청년 남성(x₃)과 물가조정 소비(x₅)를 포함하고, 이혼 변수(x₄)는 전혀 등장하지 않았다.
4. **VECM 검증**
- 공적분 모델의 구조적 일관성을 확인하기 위해 Johansen 방법을 적용한 VECM을 구축하였다. 모델 I, II, IV, VI에 대해 추세 없이 검정했을 때는 r=4(공적분 차원 4)를, 모델 III, V에 대해 추세를 포함했을 때는 r=3을 지지하였다.
- VECM과 EC 모델 간의 오류 수정 항을 매핑해 보았을 때, 모델 II는 VECM과 일관성을 유지했으며, 모델 I, IV, VI는 일부 파라미터가 통계적으로 유의하지 않음이 확인되었다. 따라서 최종적으로 모델 II가 가장 타당한 공적분 모델로 선정되었다.
5. **예측 성능 비교**
- 동일 데이터에 대해 단기 차분 모델(ARIMA 기반)과 공적분 모델을 인‑샘플 예측했으며, 평균 제곱 오차(MSE)와 평균 절대 오차(MAE) 모두에서 공적분 모델이 우수한 결과를 보였다. 이는 장기 균형 관계를 반영한 모델이 단기 변동성보다 구조적 변동을 더 잘 포착한다는 점을 시사한다.
6. **의의 및 한계**
- **의의**: 후보 모델을 전자동으로 생성·검증·선별하는 프로세스를 구현함으로써 기존의 수작업 탐색에 비해 효율성과 재현성을 크게 향상시켰다. 또한, 폭력범죄와 비서구계 청년 인구, 소비 사이의 공적분 관계를 실증적으로 밝혀 정책 입안에 활용 가능한 정량적 근거를 제공한다.
- **한계**: 데이터 기간이 1978‑2006년으로 제한돼 있어 최근 경제·사회 변화(예: 2008년 금융위기, 이민 정책 변화 등)를 반영하지 못한다. 또한, 변수 간 다중공선성 및 구조적 변동에 대한 민감도 분석이 부족하다. 향후 연구에서는 더 긴 시계열, 지역별 세분화 데이터, 베이지안 모델 평균화 등을 도입해 모델 불확실성을 정량화하고, 외생 충격에 대한 반응을 분석할 필요가 있다.
결론적으로, 제안된 모델 생성기는 대규모 후보 집합에서 공적분 관계를 효율적으로 탐색하고, 정보 기준을 통한 객관적 순위 매김을 가능하게 한다. 폭력범죄와 경제·인구 변수 간의 장기적 연계성을 이해하고, 정책 시뮬레이션에 적용할 수 있는 견고한 통계 모델을 제공한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기