미네소타 대장 직장암 공간 패턴 분석과 위험 요인
초록
본 연구는 1998‑2002년 미네소타 암 감시 시스템에서 수집된 16개 카운티(미니애폴리스·세인트폴 대도시권) 데이터를 이용해 대장암과 직장암 두 개의 마크된 점패턴을 동시에 분석한다. 로그 가우시안 콕스 프로세스(LGCP) 모델에 지역 빈곤율, 대도시 내·외부 위치와 같은 공간 공변량, 환자 연령·암 병기와 같은 개인 수준 위험 요인을 포함시켜 각 암종의 상대 강도(로그 상대 강도) 지도를 추정하였다. 결과는 대장암이 내·외곽 지역 특히 남·서쪽 교외에서 상대 강도가 높으며, 연령·병기에 따라 두 암종 간 차이가 뚜렷함을 보여, 대장암 조기 검진을 해당 지역에 집중할 필요성을 시사한다.
상세 분석
이 논문은 공간 통계학과 역학을 접목한 마크된 점패턴 분석의 최신 사례로, 두 암종을 독립적인 점패턴이라기보다 상호 연관된 마크(대장·직장)로 간주한다. 데이터는 1998‑2002년 미네소타 암 감시 시스템(MNCR)에서 추출된 16개 카운티(인구 2백만 이상) 내 4,500여 건의 대장암·직장암 발생 사례이며, 각 사건은 위도·경도 좌표와 환자 연령, 암 병기(0‑IV)라는 마크 정보를 갖는다.
모델링 단계는 먼저 로그 가우시안 콕스 프로세스(LGCP)를 기반으로 두 점패턴의 강도 함수를 정의한다. 강도 λ_i(s) (i=colon, rectum)는
log λ_i(s)=β_{0i}+β_{1i}·Age+β_{2i}·Stage+γ_i·Poverty(s)+δ_i·Metro(s)+w_i(s)
여기서 w_i(s)는 공간적으로 상관된 가우시안 랜덤 필드이며, 두 암종 간 상호 의존성을 반영하기 위해 w_colon(s)와 w_rectum(s) 사이에 공분산 구조를 도입한다. 즉, 두 필드가 동일한 공통 라플라시안 기반 커널을 공유하면서 상관계수 ρ를 통해 연관성을 모델링한다.
공간 공변량으로는 미국 인구조사 데이터에서 추출한 소득 대비 빈곤율(Poverty)과 해당 위치가 대도시 중심부(Metro=1) 혹은 외곽(=0)인지 여부를 사용하였다. 개인 수준 변수는 연령(Age, 연속형)과 암 병기(Stage, 범주형)를 포함했으며, 연령·병기와 공간 변수 간의 교차항을 추가해 비선형 상호작용을 탐색했다.
베이지안 추정은 INLA(Integrated Nested Laplace Approximation)를 활용했으며, 사전분포는 β 계수에 대해 비정보적 정규분포, 공간 필드 w_i(s)에 대해서는 Matern 공분산을 갖는 GMRF(가우시안 마르코프 랜덤 필드)를 지정했다. 모델 적합도는 DIC(Deviance Information Criterion)와 WAIC를 통해 비교했으며, 최종 모델은 공간 상관성(ρ≈0.45)과 연령·병기 상호작용이 유의미함을 보여준다.
결과적으로 대장암의 로그 상대 강도는 연령이 65세 이상일 때 급격히 상승하고, 병기 I–II에서 특히 높은 값을 보였다. 반면 직장암은 연령 증가와는 비교적 완만한 관계를 유지했으며, 병기 III–IV에서 강도가 상승하는 경향이 있었다. 공간적으로는 대도시 중심부와 남·서쪽 교외 지역에서 대장암 강도가 현저히 높았으며, 빈곤율이 높은 지역에서는 직장암 강도가 약간 상승하는 패턴을 보였다. 두 암종 간 상관계수 ρ가 0.45로 양의 상관을 나타내지만, 완전 동시 발생을 설명하기엔 부족함을 시사한다.
이러한 분석은 기존에 “대장·직장암을 하나의 질환군”으로 취급하던 역학 연구와 차별화된다. 공간-비공간 공변량을 동시에 고려한 LGCP 모델은 지역 맞춤형 예방·검진 정책 수립에 직접 활용 가능하다. 특히, 대장암 검진을 내·외곽 교외 지역에 집중하고, 직장암 위험이 높은 저소득 지역에서는 생활 습관 개선 프로그램을 병행하는 것이 정책적 시사점으로 도출된다.
댓글 및 학술 토론
Loading comments...
의견 남기기