데이터 기반 범죄 예측을 위한 핫스팟 지도 생성
초록
본 논문은 과거 경찰 호출 데이터를 활용해 비모수적 스페이시오‑템포럴 커널 밀도 추정 모델을 제안한다. 시간대별 원형 커널과 일별 블록 가중치를 결합한 적응형 커널을 사용해 범죄 발생 확률을 추정하고, 전문가 의견을 베이지안 프레임워크에 통합한다. 델리 경찰과의 협업을 통해 실제 현장에 적용했으며, 기존 방법 대비 예측 정확도가 향상됨을 실증한다.
상세 분석
이 연구는 범죄 핫스팟 예측을 위해 기존의 단순 공간 KDE(커널 밀도 추정) 기법을 확장한다. 첫 번째 핵심은 시간대별 원형 커널을 도입해 하루 24시간을 원형(주기적) 구조로 모델링함으로써, 예를 들어 야간 23시와 새벽 1시 사이의 연속성을 자연스럽게 반영한다는 점이다. 두 번째로, 일별 블록 가중치를 적용해 최근 일주일, 2주, 4주 등 다양한 시간 창을 가중 평균함으로써 장기적인 트렌드와 단기 변동을 동시에 포착한다. 이러한 블록 가중치는 가중치 행렬을 베이지안 사전으로 설정하고, 데이터에 의해 업데이트되는 형태로 구현되어, 과거 사건이 현재 예측에 미치는 영향을 유연하게 조절한다.
또한, 적응형 커널 폭(adaptive bandwidth)을 사용한다. 사건이 밀집된 지역에서는 작은 커널 폭을, 사건이 드문 지역에서는 큰 폭을 적용해 과적합을 방지하고, 희소 데이터 상황에서도 안정적인 밀도 추정을 가능하게 한다. 이 적응형 폭은 사건 밀도에 비례해 자동으로 조정되는 규칙 기반 함수로 정의된다.
전문가 입력을 통합하는 방법도 독창적이다. 현장 경찰관이나 지역사회 담당자가 제공하는 “위험 증가/감소” 라벨을 베이지안 사후에 추가적인 조정 인자로 삽입한다. 구체적으로, 전문가가 특정 위치·시간대에 위험이 높다고 판단하면 해당 블록의 사전 가중치를 상승시키고, 반대로 위험이 낮다고 판단하면 감소시킨다. 이렇게 하면 데이터만으로는 포착하기 어려운 신규 건설 현장, 조명 변화, 교통 흐름 변동 등 실시간 상황을 모델에 반영할 수 있다.
계산 복잡도 측면에서도 주목할 만하다. 전체 데이터는 36,263개의 격자(위치)와 52주(시간)로 구성돼 12백만 건이 넘지만, KDE는 사건이 발생한 포인트만을 대상으로 연산하므로 실제 연산량은 일일 수백 건 수준에 머문다. 이는 로그 가우시안 코시 프로세스(LGCP)와 같은 포인트 프로세스 모델에 비해 계산 효율성을 크게 향상시킨다.
실험 결과는 네 가지 시나리오(순수 공간 KDE, 시간대 원형 커널만 적용, 블록 가중치만 적용, 전체 통합 모델)를 비교한다. 전체 통합 모델이 평균 정확도(Precision), 재현율(Recall), F1-score 모두에서 8~12%p 상승했으며, 특히 시간대별 변동이 큰 야간 8시‑12시 구간에서 가장 큰 개선을 보였다. 전문가 입력을 시뮬레이션한 경우에도 사전 가중치 조정만으로 모델 성능이 평균 4%p 상승하는 효과가 확인되었다.
한계점으로는 공간 균일성 가정(land use, 도로망, 강 등 물리적 장벽 무시)과 범죄 상호 의존성(보복 범죄 등) 모델링이 어려운 점을 인정한다. 또한, 전문가 입력이 주관적일 수 있어 사전 가중치 설정에 편향이 발생할 가능성도 제시한다. 향후 연구에서는 공간 가중치 행렬을 도입해 지리적 제약을 반영하고, 포인트 프로세스와 결합한 하이브리드 모델을 탐색할 계획이다.
전반적으로 이 논문은 비모수적 스페이시오‑템포럴 KDE를 기반으로 전문가 의견을 베이지안 방식으로 융합한 실용적인 범죄 핫스팟 예측 프레임워크를 제시하며, 대규모 도시 경찰 운영에 바로 적용 가능한 수준의 정확도와 효율성을 입증했다.
댓글 및 학술 토론
Loading comments...
의견 남기기