최근접 이웃 표에 기반한 클래스별 공간 분리 검정
초록
본 논문은 두 개 이상의 군집(또는 종) 사이의 공간적 상호작용을 평가하기 위해 최근접 이웃(contingency) 표(NNCT)를 이용한 검정 방법을 다룬다. 기존 Dixon의 전체 χ² 검정을 클래스별로 분해한 두 가지 검정(기존 Dixon 클래스‑특정 검정과 새롭게 제안된 클래스‑특정 검정)을 제시하고, 이들 검정이 CSR 독립과 무작위 라벨링(RL) 하에서 각각 조건부·비조건부 특성을 갖는다는 점을 분석한다. 또한, 모수적·비모수적 시뮬레이션을 통해 Type I 오류와 검정력(파워)을 비교하고, 실제 데이터 세 사례를 통해 적용 방법을 안내한다.
상세 분석
논문은 공간통계학에서 흔히 다루는 ‘분리(segregation)’와 ‘연관(association)’ 현상을 정량화하기 위해 최근접 이웃(contingency) 표(NNCT)를 활용한다. NNCT는 각 점을 기준점으로 삼아 가장 가까운 이웃(NN)의 클래스 정보를 행·열에 기록함으로써, 관측된 이웃 관계를 2×2(또는 그 이상) 교차표 형태로 요약한다. 이때 귀무가설은 NN 구조가 무작위(Randomness)라는 것으로, 두 가지 구체적 상황—무작위 라벨링(RL)과 완전무작위(CSR) 독립—을 고려한다. RL은 위치는 고정하고 라벨만 무작위로 재배치하는 경우이며, CSR 독립은 각 클래스가 독립적인 포아송 프로세스로 발생한다는 가정이다.
Dixon(1994)이 제안한 전체 χ² 검정은 관측된 NNCT와 기대값(무작위 가정 하의 기대값) 사이의 차이를 측정한다. 그러나 전체 검정은 어느 클래스가 주도적으로 분리 혹은 연관을 보이는지 구체적인 정보를 제공하지 못한다. 이를 보완하기 위해 Dixon은 클래스별 검정(statistic C_i)을 도입했으며, 이 검정은 각 행(또는 열)의 관측 빈도와 기대 빈도의 차이를 별도로 평가한다. 논문은 이러한 Dixon의 클래스‑특정 검정을 재검토하고, 새로운 클래스‑특정 검정(statistic S_i)을 제안한다. S_i는 전체 χ² 통계량을 행과 열의 두 축으로 동시에 분해하여, 행‑기준(‘row‑specific’)과 열‑기준(‘column‑specific’) 두 종류의 통계량을 도출한다.
핵심 이론적 결과는 다음과 같다. 첫째, CSR 독립 하에서는 NNCT가 전체 점의 수와 클래스 비율에 의해 조건부 분포를 갖는다. 따라서 Dixon과 S_i 모두 조건부 χ² 분포를 따르며, 자유도는 (k−1)²(k는 클래스 수)이다. 반면 RL 하에서는 NN 구조가 점들의 위치에만 의존하므로, 검정통계량은 비조건부 분포를 가진다. 둘째, 두 검정은 일관성(consistency)을 보이며, 표본 크기가 커질수록 실제 분리·연관 효과를 정확히 탐지한다. 셋째, 모의실험을 통해 Type I 오류율을 검증한 결과, 두 검정 모두 명시된 유의수준(α=0.05) 근처에서 안정적인 오류율을 유지한다. 검정력 비교에서는 특정 상황—예를 들어 한 클래스가 강하게 다른 클래스와 연관될 때—S_i가 Dixon 검정보다 약간 높은 파워를 보였으며, 반대로 순수한 분리 상황에서는 두 검정이 거의 동등한 성능을 나타냈다.
실제 데이터 적용 사례로는 (1) 미국 뉴저지 주의 수목 분포, (2) 암 발생 위치 데이터, (3) 도시 범죄 사건 위치가 제시된다. 각 사례에서 NNCT를 구성하고, 두 종류의 클래스‑특정 검정을 수행함으로써, 어느 클래스가 공간적으로 군집화되는지 혹은 다른 클래스와 교차하는지를 명확히 파악할 수 있었다. 특히, 새로운 S_i 검정은 행‑기준과 열‑기준 결과가 서로 다를 때, 즉 한 클래스는 자신의 동종군과 군집하지만 다른 클래스와는 연관되는 복합 패턴을 식별하는 데 유용함을 보여준다.
마지막으로 논문은 실무 적용을 위한 가이드라인을 제시한다. 데이터 전처리 단계에서 최소 거리 제약(minimum distance)와 경계 효과(edge correction)를 고려해야 하며, 표본 크기가 작을 경우 부트스트랩이나 퍼뮤테이션을 통한 p‑값 추정이 권장된다. 또한, 검정 선택 시 연구 목적—예: 특정 클래스의 분리 정도를 중점적으로 보고 싶은 경우 Dixon 검정, 복합적인 행·열 상호작용을 동시에 탐색하고 싶은 경우 S_i 검정—에 따라 적절히 선택하도록 조언한다.
댓글 및 학술 토론
Loading comments...
의견 남기기