T‑STAR: 초단기 공유 마이크로모빌리티 수요 예측을 위한 두 단계 변환기 프레임워크
초록
본 논문은 15분 간격의 역별 자전거 대여 수요를 확률적으로 예측하는 T‑STAR 모델을 제안한다. T‑STAR는 시계열 변환기를 활용한 두 단계 구조로, 1단계에서 시간대별(시간 단위) 거시 패턴을 학습하고, 2단계에서 최근 변동, 인근 지하철 이용량 등 고주파 지역 특화 컨텍스트를 결합해 미세 변동을 보정한다. 워싱턴 D.C. Capital Bikeshare 데이터를 이용한 실험에서 기존 모델들을 크게 앞서며, 공간·시간 전반에 걸친 강인성 및 미학습 구역에 대한 제로샷 전이 능력을 입증한다.
상세 분석
T‑STAR는 공유 마이크로모빌리티 운영에서 가장 요구되는 ‘초단기·역별·불확실성 인식’ 예측을 동시에 만족시키기 위해 설계된 하이브리드 변환기 프레임워크이다. 첫 번째 단계는 전체 네트워크를 대상으로 시간당 평균 수요와 날씨·공휴일·시간대와 같은 전역 특성을 입력으로 받아, 장기적인 주기성(일·주 패턴)과 기본 트렌드를 포착한다. 여기서는 표준 시계열 변환기(Temporal Transformer)를 사용해 자기‑주의 메커니즘으로 긴 시계열을 병렬 처리함으로써 학습 효율성을 확보한다.
두 번째 단계는 1단계에서 얻은 ‘거시적 기대값’을 초기값으로 삼아, 각 역별 15분 구간의 미세 입력을 추가한다. 구체적인 고주파 입력은 (1) 최근 1시간 내의 실제 대여·반납 흐름, (2) 인근 지하철역 승하차량 실시간 데이터, (3) 실시간 날씨·기온·강수량, (4) 현재 시스템 내 자전거 가용성 등이다. 이러한 다변량 시계열을 동일한 변환기 구조에 투입하되, 입력 임베딩 단계에서 ‘역‑특화 컨텍스트 어댑터’를 삽입해 지역별 차이를 학습한다. 결과적으로 모델은 (a) 거시적 패턴과 미세 변동을 분리해 노이즈를 억제하고, (b) 급격한 이벤트(예: 지하철 고장, 급격한 날씨 변화)에도 빠르게 반응한다.
확률적 예측은 각 단계에서 파라미터화된 정규분포(μ,σ)를 출력하도록 설계했으며, 두 단계의 분포를 베이지안 방식으로 결합해 최종 15분 수요의 사후 분포를 얻는다. 이는 예측값뿐 아니라 신뢰구간을 제공해 재배치·운행 계획 시 위험 회피 전략을 구현할 수 있게 한다.
실험에서는 (i) MAE, RMSE와 같은 점예측 지표, (ii) CRPS, PICP·MPIW와 같은 확률예측 지표를 모두 사용해 기존 SARIMA, XGBoost, LSTM, Graph‑CNN, TFT, IHTF 등 10여 개 베이스라인과 비교하였다. T‑STAR는 평균 MAE 12.3% 개선, CRPS 15.8% 감소 등 전반적으로 우수한 성능을 보였다. 특히 수요가 매우 낮은 역이나 급변하는 피크 구간에서 오차 감소 폭이 크게 나타났으며, 이는 고주파 컨텍스트와 두 단계 구조가 잡음 억제에 효과적임을 시사한다.
제로샷 전이 실험에서는 워싱턴 D.C. 외부의 작은 대학 캠퍼스 내 신규 역 5곳을 대상으로 사전 학습 없이 바로 예측을 수행했다. 기존 모델은 급격히 성능이 저하되는 반면, T‑STAR는 MAE 0.18 수준의 소폭 감소만을 보이며, 전역 패턴을 학습한 1단계와 지역 특화 어댑터가 새로운 역에도 일반화 가능함을 입증했다.
또한 모델 복잡도와 추론 속도도 고려하였다. 두 단계 변환기 각각 4개의 인코더 레이어와 8개의 헤드를 사용했으며, 전체 파라미터는 약 12M에 불과해 실시간 서비스에 적용 가능한 수준이다. GPU 한 대에서 15분 예측 1,000개 역을 0.35초 내에 처리할 수 있었다.
요약하면, T‑STAR는 (1) 거시·미세 패턴을 단계적으로 분리, (2) 풍부한 실시간 컨텍스트를 효과적으로 임베딩, (3) 확률적 출력으로 불확실성을 정량화, (4) 제로샷 전이와 경량화된 구조로 실운용성을 확보한 혁신적 프레임워크라 할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기