미국 도시 규모의 파레토와 로그정규 분포 비교: 최적 무편향 검정

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 미국 2000년 인구조사 자료를 이용해 도시 규모의 상위 1,000개 도시가 파레토 분포를 따르고, 그 꼬리 지수는 1이 아닌 약 1.4임을 확인한다. 하위 도시들은 로그정규 분포가 더 적합하다는 결론에 도달한다. 이를 위해 파레토 귀무가설에 대한 균일 최강 무편향 검정(UMPU)을 적용하고, p‑값과 Hill 추정량을 도시 크기 임계값별로 분석한다. 결과는 Eeckhout와 Levy 사이의 논쟁을 통합적으로 해결한다.

상세 분석

이 연구는 “파레토 대 로그정규”라는 두 후보 분포 사이의 통계적 우열을 판단하기 위해, 기존 연구들이 사용한 검정력의 한계를 극복하고자 균일 최강 무편향 검정(UMPU)을 도입했다. UMPU 검정은 귀무가설이 파레토 분포일 때, 대립가설인 로그정규 분포에 대해 가장 높은 검정력을 유지하면서도 편향을 최소화한다는 이론적 장점을 가진다. 논문은 먼저 2000년 미국 인구조사에서 추출한 3,000여 개 도시(인구 5,000명 이상)를 대상으로, 도시 규모를 하한값 (x_{0})에 따라 서브샘플링한다. 각 (x_{0})에 대해 Hill 추정량 (\hat{\alpha}(x_{0}))와 검정 p‑값을 계산함으로써, 파레토가 유의미하게 유지되는 구간과 로그정규가 더 적합한 구간을 명확히 구분한다. 결과는 (x_{0})가 약 100,000명(상위 1,000개 도시) 이상일 때 p‑값이 0.05 이상으로 유지되어 파레토 가설을 기각할 근거가 부족함을 보여준다. 동시에 Hill 추정량은 (\hat{\alpha}\approx1.4\pm0.1)로, 전통적인 Zipf 법칙(지수 1)과는 현저히 차이가 있음을 확인한다. 반면, (x_{0})를 낮춰 하위 도시들을 포함시키면 p‑값이 급격히 감소하고 Hill 추정량이 감소하는 경향을 보이며, 이는 로그정규 분포가 데이터에 더 잘 맞는다는 강력한 증거가 된다. 이와 같은 정량적 분석은 Eeckhout(2004,2009)가 제시한 파레토 지배와 Levy(2009)가 주장한 로그정규 우세 사이의 모순을 해소한다. 또한, Gibrat 법칙(비례 성장 법칙)이 파레토와 로그정규 두 분포 모두를 발생시킬 수 있는 메커니즘임을 강조하면서, 두 분포의 차이는 성장 과정에서의 변동성(분산)과 하한 제한(최소 도시 규모) 설정에 기인한다는 이론적 해석을 제공한다. 특히, Gabaix(1999)와 Eeckhout(2004)의 확률적 성장 모델을 확장해, 성장률의 평균이 0에 가깝고 분산이 일정할 경우 파레토 꼬리가 형성되며, 성장률 분산이 크고 하한이 존재할 경우 로그정규 형태가 지배한다는 점을 실증적으로 입증한다. 최종적으로, 논문은 통계적 검정 설계와 경제학적 성장 이론을 결합함으로써 도시 규모 분포 연구에 새로운 표준을 제시한다.

미국 도시 규모의 파레토와 로그정규 분포 비교: 최적 무편향 검정

초록

상세 분석

댓글 및 학술 토론

의견 남기기