도시 영향력 측정을 위한 트위터 기반 인간 이동 분석
초록
전 세계 58개 대도시를 대상으로 지리정보가 포함된 트위터 데이터를 활용해 방문자와 거주자의 이동 패턴을 추적하였다. 평균 이동 반경, 정규화된 반경, 방문 셀 수(coverage) 등 세 가지 지표로 도시의 ‘확산력’을 정량화하고, 지역·전역 네트워크 분석을 통해 글로벌·지역 중심 도시를 도출했다.
상세 분석
본 연구는 인간 이동을 ‘정보 전파’의 물리적 매개체로 가정하고, 트위터에 남긴 위치 데이터를 인간의 실제 이동 경로의 대리 변수로 활용하였다. 데이터는 2010년 10월부터 2013년 6월까지 1000일간 수집된 21 017 892개의 지오태그 트윗이며, 571 893명의 사용자 평균 36개 트윗을 제공한다. 비인간 계정은 시속 750 km를 초과하는 이동 속도로 필터링하였다.
도시 정의는 ‘시청을 중심으로 반경 50 km 원형 구역’으로 일관되게 설정했으며, 이는 행정구역 차이에 따른 편향을 최소화한다. 거주지 판별은 전 세계를 100 km × 100 km 격자로 나눈 뒤, 각 사용자가 가장 많이 트윗한 격자를 거주지로 지정하고, 전체 트윗 중 1/3 이상을 해당 격자에서 발생시킨 경우에만 유효 사용자로 인정하였다.
도시 영향력 측정은 세 가지 지표로 구성된다.
- 평균 반경(R): 선택된 u = 300명의 사용자가 첫 방문 이후 Δt = 350일 동안 기록한 위치와 도시 중심 간 거리 평균. 초기 15–20일 구간에서는 모든 도시가 √Δt보다 빠른, 거의 선형에 가까운 성장(Levy flight 특성)을 보이며, 이후 성장률이 급격히 감소한다. 이는 비거주자(비지역 방문자)의 초기 대규모 이동과 그들의 귀환 현상을 반영한다.
- 정규화 평균 반경(˜R): R을 전 세계 트위터 사용자들의 평균 거주지-도시 거리로 나누어 지리적 편향을 보정한다. 원시 R은 섬·극지 등 고립된 도시가 과대평가되는 문제를 해결한다. 정규화 후 상위 도시는 로마, 파리, 리스본 등 유럽 고밀도 지역에 집중된다.
- Coverage: 100 km × 100 km 격자 단위로 사용자가 방문한 셀 수를 집계한다. 이는 거리와 무관하게 ‘얼마나 넓은 영역에 영향을 미쳤는가’를 측정한다. Coverage와 R은 높은 상관관계를 보이지만, 일부 도시는 높은 R에도 불구하고 상대적으로 적은 셀을 방문하는 등 차이를 나타낸다.
지역 주민과 비지역 방문자를 구분한 결과, 비지역 방문자는 평균 260개의 셀을 방문해 확산력에 크게 기여하는 반면, 지역 주민은 약 96개의 셀에 머물며 이동 범위가 제한적이다. 비지역 방문자의 비중이 높은 도시가 정규화 반경과 Coverage 모두에서 상위에 오르는 경향을 보인다.
도시 간 이동 네트워크는 각 도시를 정점, 비지역 방문자 흐름을 가중치로 하는 방향성 간선으로 구성하였다. 전역 중심성 분석에서는 뉴욕과 런던이 가장 높은 베트위니스와 클로즈니스 점수를 획득했으며, 이는 기존 세계 도시 네트워크 연구와 일치한다. 그러나 지역(예: 아시아·태평양, 유럽) 수준에서 중심성 순위는 크게 변동한다; 홍콩·싱가포르·시드니 등이 지역 허브로 부상한다.
이러한 결과는 (1) 트위터 기반 이동 데이터가 전통적인 경제·인프라 지표와는 다른 ‘사회적·문화적 연결성’을 포착한다, (2) 도시 영향력은 단순 인구·GDP가 아니라 방문자 구성비와 이동 패턴에 크게 좌우된다, (3) 전역·지역 네트워크를 동시에 고려해야 글로벌 도시 계층 구조를 정확히 이해할 수 있음을 시사한다.
댓글 및 학술 토론
Loading comments...
의견 남기기