인간 이동 모델을 위한 상징 회귀 기반 공식 추출
초록
**
본 논문은 대규모 이동 데이터에 상징 회귀(Symbolic Regression)를 적용해 인간 이동 현상을 설명하는 해석 가능한 수식들을 자동으로 발견한다. 기존의 중력 모델·방사 모델을 재현함은 물론, 거리 감쇠를 지수‑멱법칙 형태로 표현하는 새로운 식을 제시한다. 모델 복잡도와 정확도 사이의 파레토 최적화를 통해 변수들의 단계적 포함 과정을 분석하고, 국가·스케일별 이질성을 확인한다.
**
상세 분석
**
이 연구는 인간 이동을 설명하는 전통적 모델이 물리적 직관에 의존해 왔던 한계를 극복하고, 관측 데이터 자체로부터 수학적 구조를 추출하는 방법론을 제시한다. 핵심은 ‘allocation weight’ (f_{ij}) 를 목표 함수로 설정하고, 이를 유전‑기반 상징 회귀 프레임워크에 입력함으로써 흐름 (F_{ij}) 예측을 간접적으로 최적화한다는 점이다. 이렇게 하면 전체 흐름 모델의 복잡도가 크게 감소하고, 연산 효율성이 크게 향상된다.
연산 과정은 다음과 같다. 먼저 네 가지 설명 변수(출발지·도착지의 직장·주거 인구 (w_i, r_i), 거리 (d_{ij}), 그리고 ‘intervening opportunities’ (s_{ij}))와 기본 연산자(+, −, ×, ÷, ^, exp, ln)를 정의한다. 이후 유전 프로그래밍을 통해 표현식 트리를 무작위로 생성·교배·돌연변이시키며, 각 표현식에 대해 평균제곱오차(MSE)와 복잡도(노드 수)를 동시에 평가한다. 복잡도에 대한 페널티 (\lambda) 를 조정함으로써 파레토 전선을 형성하고, 사용자는 원하는 복잡도 수준에서 최적의 모델을 선택할 수 있다.
실험에서는 중국(광동·베이징‑톈진‑허베이), 영국, 미국의 4개 데이터셋을 활용하였다. 각 데이터셋은 통신 기록·인구 조사·통계청 자료 등에서 추출된 이동 흐름과 인구·거리 정보를 포함한다. 결과적으로 ‘거리‑지수 감쇠’ 형태인 (f_{ij}=m_j/d_{ij}^{\beta}) 가 가장 낮은 복잡도(5노드)에서 일관되게 등장했으며, 이는 전통적 중력 모델의 핵심 구조와 일치한다. 복잡도를 늘리면 기존 방사 모델, Schneider의 intervening opportunity 모델 등도 재현되었다. 특히, 복합 연산자와 로그·지수 함수를 결합한 새로운 식
\
댓글 및 학술 토론
Loading comments...
의견 남기기