인간 이동 패턴의 숨은 규칙: 개인별 정규성에서 보편적 확률분포까지
100,000명의 휴대폰 사용자를 6개월간 추적한 결과, 인간의 이동은 레비 비행이나 무작위 보행과 달리 시간·공간적으로 높은 규칙성을 보이며, 각 개인은 고유한 반경(r_g)과 몇몇 자주 방문하는 장소에 반복적으로 돌아온다. 개인별 이동 패턴을 거리와 방향의 이방성을 보정하면 모두 동일한 공간 확률분포로 수축돼, 인간 이동이 단순하고 재현 가능한 법칙에 따름을 확인했다.
저자: M.C. Gonzalez, C.A. Hidalgo, A.-L. Barabasi
본 논문은 인간 이동 패턴을 정량적으로 규명하기 위해 100 000명의 익명화된 모바일 전화 사용자를 6개월 동안 추적한 대규모 데이터셋(D1)과, 206명을 1주일 동안 2시간 간격으로 위치를 기록한 데이터셋(D2)을 활용하였다. 두 데이터 모두 통화·문자 발생 시점에 기지국 위치를 기반으로 하며, 평균 기지국 서비스 면적은 약 3 km², 일부는 1 km² 이하이다.
첫 단계에서는 연속 호출 사이의 이동 거리 ∆r의 전체 분포를 분석했으며, P(∆r) = (∆r+∆r₀)^{-β}·exp(-∆r/κ) 형태의 절단 파워‑law를 발견했다. 여기서 β≈1.75, ∆r₀≈1.5 km, κ는 D1에서 400 km, D2에서 80 km로, 기존 은행권 이동 연구에서 보고된 β≈1.59와 유사한 스케일링을 보였다. 이는 인간 이동이 레비 비행과 유사한 꼬리 특성을 가질 수 있음을 시사한다.
하지만 개별 사용자의 이동 규모를 나타내는 반경(gyration radius, r_g)를 계산한 결과, r_g 자체도 절단 파워‑law 형태(P(r_g) = (r_g+r_{g0})^{-β_r}·exp(-r_g/κ))를 따른다. β_r≈1.65, r_{g0}≈5.8 km, κ≈350 km이다. 이는 인구 수준에서 이질적인 이동 범위가 존재함을 의미한다.
가설 A(모든 개인이 동일한 레비 비행을 따름), 가설 B(관측된 분포는 인구 이질성만 반영), 가설 C(두 요인이 결합) 중 어느 것이 옳은지 검증하기 위해 무작위 보행(RW), 레비 비행(LF), 절단 레비 비행(TLF) 에이전트를 시뮬레이션하였다. 결과, 단일 레비 비행만으로는 관측된 r_g 분포를 재현하지 못했으며, 인구 이질성만으로도 충분하지 않다. 따라서 가설 C가 가장 적합함을 확인했다.
시간에 따른 r_g(t) 변화를 조사한 결과, 이론적 전력법칙(r_g∝t^{3/(2+β)} 또는 r_g∝t^{1/2})이 아니라 로그 형태의 포화 현상이 나타났다. 이는 사용자가 일정 반경 내에서 반복적으로 이동하고, 새로운 지역을 탐색하는 속도가 급격히 감소함을 의미한다.
또한, r_g가 비슷한 사용자 그룹을 선정하고 조건부 이동 거리 분포 P(∆r|r_g)를 r_g로 정규화하면 모든 그룹이 동일한 곡선으로 붕괴되었다. 이는 ∆r∼r_g^{-α}·F(∆r/r_g) 형태의 보편적 점프 크기 분포가 존재함을 보여준다(α≈1.2). 따라서 레비 비행은 r_g 이하에서는 적용될 수 있지만, r_g를 초과하는 장거리 이동은 거의 관측되지 않는다.
재방문 확률 F_pt(t)는 24 h, 48 h, 72 h 등 일일 주기의 피크를 보이며, 2차원 무작위 보행이 예측하는 1/(t·ln²t)와 크게 다르다. 이는 인간이 특정 장소(주거, 직장 등)에 주기적으로 돌아가는 강한 규칙성을 나타낸다. 위치 방문 순위 L에 대한 확률 P(L)∝1/L 형태는 사용자가 소수의 장소에 대부분의 시간을 할애하고, 나머지는 낮은 빈도로 방문한다는 행동 패턴을 확인한다.
각 사용자의 궤적을 고유 좌표계로 변환해 이방성 비율 S=σ_y/σ_x를 계산한 결과, S는 r_g가 클수록 감소해 궤적이 더 길쭉해짐을 보였다(S∼r_g^{-0.12}). 이 방식을 보정하고 각 축을 σ_x, σ_y로 정규화하면, 모든 사용자의 확률 밀도 ˜Φ(x/σ_x, y/σ_y)는 거의 동일한 형태를 가진다. 즉, 개인별 차이를 제거하면 인간 이동은 하나의 보편적 2차원 확률분포로 설명될 수 있다.
이러한 발견은 인간 이동이 레비 비행의 꼬리 현상보다, 개인별 제한된 반경과 높은 재방문율에 의해 지배된다는 점을 강조한다. 모델링 관점에서, 현실적인 에이전트 기반 시뮬레이션은 다음 요소들을 포함해야 한다: (1) 인구 밀도에 비례한 사용자 배치, (2) 관측된 P(r_g)에서 샘플링된 r_g 값, (3) 각 사용자의 이방성 보정과 보편적 ˜Φ 형태. 이를 통해 전염병 확산, 도시 교통 예측, 재난 대응 등 다양한 분야에서 인간 이동을 정밀하게 예측하고 정책을 설계할 수 있다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기