전시 방문자 흐름의 프랙털 특성 및 네트워크 분석

본 논문은 2010년 상하이 엑스포의 일일 방문자 수 데이터를 이용해 방문자 흐름의 통계적 특성과 복잡계 네트워크 구조를 분석한다. Hurst 지수를 통해 장기적 안정성과 장기 상관성을 확인하고, 가시성 그래프 알고리즘으로 시계열을 네트워크로 변환한 결과, 네트워크가 스케일프리, 스몰월드, 계층적 구조를 갖는 것을 밝혀냈다. 또한 극단적인 방문자 수가 군집적으로 나타나는 현상을 설명한다.

저자: Chao Fan, Jin-Li Guo

전시 방문자 흐름의 프랙털 특성 및 네트워크 분석
본 논문은 2010년 상하이 엑스포(2010 Shanghai World Expo)의 일일 방문자 수 데이터를 기반으로, 방문자 흐름의 통계적 특성과 복잡계 네트워크 구조를 종합적으로 분석한다. 연구는 크게 네 단계로 진행되었다. 첫 번째 단계에서는 데이터 수집 및 전처리를 수행하였다. 공식 웹사이트에서 184일간(5월 1일~10월 31일) 일일 방문자 수를 추출했으며, 총 방문자 수는 약 7,309만 명, 일 평균 방문자 수는 약 39만 7천 명으로 보고되었다. 월별 평균 및 표준편차를 계산한 결과, 5월은 방문자 수가 가장 적고 변동성이 크며, 7월은 가장 안정적인 흐름을 보였다. 10월 말에는 전시 종료 직전 급증 현상이 나타났다. 두 번째 단계에서는 시계열의 장기적 특성을 평가하기 위해 Rescaled Range (R/S) 분석을 적용하였다. Hurst 지수는 0.856( R²=0.985)으로, 0.5보다 크게 나타나 시계열이 장기 기억을 갖는 프랙털 구조임을 확인했다. 이는 방문자 흐름이 단순한 무작위 과정이 아니라 과거의 변동이 미래에도 지속되는 경향이 있음을 의미한다. 세 번째 단계에서는 가시성 그래프(Visibility Graph) 알고리즘을 이용해 시계열을 네트워크로 변환하였다. 각 일자를 노드로, 두 일자 사이에 직선 가시성이 존재하면 엣지를 연결하는 방식으로 184개의 노드와 676개의 엣지를 가진 네트워크를 구축했다. 이후 네트워크의 주요 토폴로지 지표를 계산하였다. - **평균 차수(k̄)**는 7.348로, 일부 노드가 다수의 연결을 가지고 있음을 시사한다. - **평균 클러스터링 계수(C̄)**는 0.789로, 무작위 그래프 대비 높은 지역적 연결성을 나타낸다. - **네트워크 직경(D)**은 8, **평균 최단 경로 길이(L)**는 3.447로, 스몰월드 특성을 만족한다. - **차수 분포**는 P(k)∝k⁻²·³⁷ 형태의 파워‑law를 따르며, 스케일프리 네트워크임을 확인했다. - **클러스터링 계수와 차수의 관계**는 C(k)∝k⁻⁰·⁹⁷으로, 차수가 클수록 이웃 간 연결이 희박해지는 계층적 구조를 보인다. - **피어슨 차수 상관계수(r)**는 0.115로 양의 상관을 보이며, 고차수 노드가 서로 선호적으로 연결되는 양성 상관(assortative mixing) 특성을 가진다. - **최근접 이웃 평균 차수 ⟨k_nn⟩(k)**는 k와 양의 상관을 보여, 차수가 큰 노드일수록 이웃도 높은 차수를 갖는 경향이 있다. 네 번째 단계에서는 네트워크 특성과 실제 방문자 수 사이의 관계를 탐색했다. 차수가 높은 노드가 해당 일의 방문자 수가 평균보다 현저히 높은 경우와 일치함을 확인하였다. 예를 들어 5월 15일은 차수 18, 방문자 수 335,300명으로 주변 일(≈180,000~300,000명)보다 크게 초과한다. 이러한 허브 노드들은 연속된 기간에 걸쳐 군집적으로 나타나, 7월 10일~28일, 10월 14일~24일 등에서 높은 방문자 흐름이 지속되었다. 전체적으로, 연구는 다음과 같은 주요 결론을 도출한다. 첫째, Expo 2010 방문자 흐름은 Hurst 지수와 가시성 그래프 분석을 통해 프랙털적 장기 상관성을 가진다. 둘째, 변환된 네트워크는 스케일프리, 스몰월드, 계층적 구조를 동시에 보여, 시계열 데이터 간에 복잡하고 비선형적인 연결성이 존재함을 의미한다. 셋째, 극단적인 방문자 수(허브)는 단독으로 발생하기보다 주변 일들과 군집을 이루어 나타나며, 이는 이벤트 운영 및 인프라 관리 시 연속적인 피크를 대비해야 함을 시사한다. 마지막으로, 가시성 그래프를 활용한 시계열‑네트워크 변환 방법은 대규모 인간 행동 데이터(전시, 축제, 회의 등)의 구조적 특성을 파악하고 예측 모델을 설계하는 데 유용한 도구가 될 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기