베이지안 조합 시계열로 보는 인바운드 관광 수요 구성 예측

베이지안 조합 시계열로 보는 인바운드 관광 수요 구성 예측
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 Airbnb 예약 데이터를 활용해 2017‑2024년 기간 동안 네 개 지역(EMEA, 북미, 아시아‑태평양, 라틴아메리카)의 방문객 원천 시장 점유율 변화를 베이지안 디리클레 ARMA(BDARMA) 모델로 예측한다. 코로나19로 인한 구조적 변화를 포착하고, 계절적 정밀도 변동을 포함한 모델이 기존 변환 기반 벤치마크보다 평균 절대오차와 Aitchison 거리에서 유의하게 우수함을 입증한다.

상세 분석

이 연구는 관광 수요의 ‘구성(composition)’이라는 특수한 데이터 특성을 정확히 반영하기 위해 단순히 총량을 예측하는 전통적 시계열 방법을 탈피한다. 구성 데이터는 각 원소가 0과 1 사이에 존재하고 전체 합이 1이 되는 단순합(simplex) 공간에 존재하기 때문에, 일반적인 ARIMA나 ETS와 같은 방법을 그대로 적용하면 음수값이나 100% 초과와 같은 비현실적인 예측이 발생한다. 저자들은 이러한 문제를 해결하기 위해 Dirichlet 분포를 기반으로 한 베이지안 프레임워크인 BDARMA 모델을 도입한다.

모델은 먼저 평균 구성 μₜ를 isometric log‑ratio(ILR) 변환을 통해 실수 공간 ℝ^{C‑1}으로 옮긴 뒤, VARMA 구조를 적용한다. 여기서 VAR(autoregressive)와 MA(moving average) 행렬은 각각 C‑1 차원의 벡터를 다루며, 계절성을 설명하기 위해 Fourier 기반 외생변수를 포함한다. 특히 정밀도 파라미터 ϕₜ를 로그 선형 형태로 계절적 코사인·사인 항에 연결함으로써, 여름과 같은 성수기에는 구성 변동성이 낮고 비수기에는 변동성이 커지는 현상을 모델링한다.

베이지안 추정은 Stan을 이용한 MCMC로 수행되며, 약한 정규 사전분포를 설정해 데이터에 충분히 의존하도록 설계되었다. 수렴 진단은 ˆR과 ESS로 확인했으며, 4,000개의 사후 샘플을 확보한다. 예측 단계에서는 사후 파라미터를 이용해 h‑step‑ahead VARMA 재귀를 전진시키고, 각 시점마다 Dirichlet 예측분포에서 샘플을 추출한다. 점예측은 사후 평균, 구간예측은 사후 분위수를 사용한다.

성능 평가는 MAE, Aitchison 거리, 로그예측밀도(LPD) 등 복합 지표를 사용했으며, 베이스라인으로는 순방향(naïve), 계절 순방향, 12개월 이동평균, ILR 변환 후 ETS, SARIMA 등을 포함한다. 교차검증은 LOO‑CV와 Pareto‑smoothed importance sampling을 통해 ELPD와 p_loo를 비교했으며, Diebold‑Mariano 검정으로 통계적 유의성을 검증했다. 결과는 EMEA 지역에서 BDARMA가 naïve 대비 27% 낮은 오류를 보였고(p < 0.001), 특히 5‑25% 점유율 구간의 다중 시장 경쟁이 심한 경우에 가장 큰 개선 효과를 나타냈다. 정밀도에 계절성을 도입한 모델이 정밀도 고정 모델보다 평균 MAE가 약 12% 개선되는 등, 정밀도 변동을 고려하는 것이 예측 정확도에 크게 기여한다는 점이 강조된다.

이와 같이 BDARMA는 구성 데이터의 단순합 제약을 자연스럽게 만족하면서도 복잡한 시계열 의존성 및 계절적 변동성을 동시에 포착한다. 관광 정책 입안자는 이 모델이 제공하는 확률적 예측(예: 95% 신뢰구간)과 정밀도 지표를 활용해 마케팅 예산 배분, 인프라 투자, 위기 대응 전략을 보다 정교하게 설계할 수 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기