전 세계 테러 공격 분석을 위한 데이터 마이닝 통합 모델 연구
초록
본 논문은 1970년부터 2015년까지 156,772건의 테러 사건 데이터를 구축하고, Lazy Tree, 다층 퍼셉트론(MLP), 다중 클래스 및 나이브 베이즈 분류기를 적용해 공격 책임자를 예측한다. 분류 성능 비교와 함께 UN의 대테러 역할을 논의하고, 공격 빈도·지역·피해 규모의 장기적 추세를 제시한다.
상세 분석
본 연구는 테러리즘 데이터가 공개적으로 제한된 상황에서, 다중 출처(예: Global Terrorism Database, UN 보고서, 국가별 보안기관)로부터 1970‑2015년 사이의 156,772건의 사건을 수집·정제하여 자체 데이터베이스를 구축한 점이 가장 큰 강점이다. 데이터 전처리 단계에서는 결측값 보완, 범주형 변수의 원-핫 인코딩, 시간 변수의 연도·월·요일 파생, 그리고 지리적 좌표를 기반으로 지역 클러스터링을 수행하였다. 이렇게 정제된 데이터는 ‘공격 책임자(테러 조직)’를 목표 클래스(label)로 설정하고, 12개의 설명 변수(공격 유형, 무기 종류, 목표 대상, 사망·부상 인원, 피해액, 사건 발생 국가·도시, 연도·월 등)를 입력 피처로 활용한다.
분류 모델로는 (1) Lazy Tree(최근접 이웃 기반 트리), (2) 다층 퍼셉트론(MLP, 은닉층 2개, ReLU 활성화, Adam 최적화), (3) 다중 클래스(One‑vs‑Rest 로지스틱 회귀 기반), (4) 나이브 베이즈(가우시안 및 다항식 변형) 네 가지를 선택하였다. 각 모델은 10‑fold 교차 검증을 통해 정확도, 정밀도, 재현율, F1‑score, 그리고 다중 클래스 상황에 적합한 매크로 평균을 평가 지표로 사용하였다. 결과적으로 MLP가 78.4%의 정확도와 0.71의 매크로 F1‑score로 가장 우수했으며, Lazy Tree는 빠른 학습 속도와 비교적 높은 재현율(0.69)로 실시간 위험 감시 시스템에 적합함을 시사한다. 반면 나이브 베이즈는 클래스 불균형에 취약해 정확도가 62% 수준에 머물렀다.
통계적 분석에서는 연도별 공격 건수가 1990년대 초 급증 후 2000년대 중반까지 지속적으로 상승했으며, 2010년대 들어서야 완만한 감소 추세를 보였다. 지역별로는 중동·북아프리카(MENA) 지역이 전체 사건의 42%를 차지했으며, 특히 시리아·이라크·아프가니스탄에서 고위험 클러스터가 형성되었다. 공격 유형별로는 폭발물 사용이 55%로 가장 흔했으며, 총 사망자 수는 1970‑2015년 동안 약 1,200,000명, 직접 재산 피해액은 약 1조 달러에 달한다.
UN의 역할에 대한 논의에서는, UN 안보리 결의(예: 1373, 1566)와 국제 협력 메커니즘이 데이터 공유와 예방 정책 수립에 기여했으나, 실제 현장 적용에서는 국가별 정보 보호 정책과 데이터 표준화 부재가 큰 장애물로 작용한다는 점을 지적한다. 논문은 이러한 제약을 극복하기 위해, 표준화된 테러 데이터 포맷(예: STIX/TAXII)과 블록체인 기반 데이터 무결성 검증 체계 도입을 제안한다.
전반적으로 본 연구는 대규모 테러 데이터셋 구축, 다중 분류기 성능 비교, 그리고 정책적 함의를 동시에 제공함으로써, 학계·실무 모두에 실용적인 인사이트를 제공한다. 특히 MLP 기반 예측 모델은 향후 실시간 위협 감시와 사전 예방 시스템에 적용 가능성이 높으며, 데이터 표준화와 국제 협력 강화를 통해 모델의 일반화 성능을 더욱 향상시킬 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기