핀란드 철도망 셀룰러 지연 예측: 머신러닝 기반 접근
초록
본 논문은 핀란드 Digirail 프로젝트에서 수행한 전국 철도 구간의 4G/LTE·5G 네트워크 지연 측정을 바탕으로, 패킷 복제 모드(Packet Replication, PR) 데이터를 이용해 머신러닝 모델을 학습한다. 최적 모델을 이용해 Best Quality 모드로만 측정된 구간에 대한 PR‑모드 지연을 추정하고, 이를 통해 공공 셀룰러망이 철도 제어에 요구되는 엄격한 지연·신뢰성 기준을 충족할 수 있음을 입증한다.
상세 분석
이 연구는 기존의 Best Quality(BQ) 모드가 5초마다 한 번씩만 네트워크 상태를 평가하고, 측정 자체가 인위적인 지연을 초래한다는 한계를 명확히 인식하고, 실제 운영 환경을 더 정확히 반영하는 Packet Replication(PR) 모드 데이터를 중심으로 모델링을 전개한다. PR 모드는 다중 SIM을 장착한 멀티채널 라우터를 이용해 동시에 여러 이동통신사의 라우팅 경로에 패킷을 전송하고, 가장 빠르게 도착한 패킷을 유효 데이터로 채택함으로써 네트워크 변동에 따른 지연 편향을 최소화한다.
데이터셋은 1초 간격으로 수집된 GNSS 위치, 열차 속도, RSRP·RSRQ·SNR 등 신호 품질 지표와 TCP, HTTP, DNS, Position Report, MA Request 등 각각의 지연값을 포함한다. 특히 MA Request는 10초 간격으로 기록돼, 다양한 시간 스케일의 지연 특성을 포착한다.
모델링은 회귀 문제로 정의했으며, 입력 피처는 세 이동통신사 전부의 KPI와 열차 속도 등 총 10여 개 변수이다. 네 가지 대표적인 트리 기반 알고리즘—Random Forest, XGBoost, LightGBM, CatBoost—를 동일한 하이퍼파라미터(100개의 트리/반복, 고정 시드) 조건에서 학습시켜 RMSE, R², MAE, Precision, Recall을 종합적으로 평가하였다. 결과적으로 Position Report, TCP, HTTP, DNS는 Random Forest가 가장 낮은 RMSE와 높은 R²를 기록했으며, MA Request에서는 XGBoost가 R² 0.97이라는 뛰어난 설명력을 보였다.
모델의 특성 해석에서는 열차 속도가 가장 중요한 피처로 도출되었으며, 이는 이동 중 셀룰러 기지국 간 핸드오버와 전파 환경 변화가 지연에 직접적인 영향을 미친다는 점을 시사한다. 또한, 임계값(500 ms, 1000 ms)을 초과하는 ‘크리티컬’ 구간을 탐지하는 정밀도와 재현율을 함께 고려했을 때, 대부분의 모델이 재현율을 0.8 이상 확보하면서도 과도한 오탐을 최소화하는 균형을 이루었다.
학습된 최적 모델을 이용해 BQ 모드만 측정된 8,000 km 구간에 대한 PR‑모드 지연을 합성 생성함으로써, 실제 측정이 어려운 전 구간에 대한 통계적 지연 분포를 확보했다. 생성된 데이터는 실제 PR 모드 측정치와 중앙값·중위수·평균 등 주요 통계량에서 높은 일치도를 보였으며, 최대값과 변동성 측면에서는 실제 측정치가 다소 넓은 범위를 나타냈다. 이는 모델이 극단적인 지연 상황을 보수적으로 추정하는 경향이 있음을 의미한다.
신뢰성 평가에서는 BQ 모드가 인위적 지연으로 인해 임계 초과 비율이 현저히 높았으며, PR 모드와 ML‑생성 PR 모드는 0.01 % 이하의 크리티컬 이벤트 비율을 보였다. 이는 공공 LTE/5G망이 철도 제어용 통신(ETCS, FRMCS)의 엄격한 지연·신뢰성 요구사항을 충분히 만족한다는 실증적 근거가 된다.
전반적으로 이 논문은 (1) 실제 운영 환경에 가까운 PR 모드 측정이 지연 모델링에 필수적임을, (2) 트리 기반 앙상블 모델이 구조화된 네트워크 KPI와 열차 동역학 데이터를 효과적으로 학습해 높은 예측 정확도를 달성함을, (3) 머신러닝 기반 지연 추정이 대규모 측정 비용을 절감하고 향후 네트워크 설계·운영 의사결정에 활용될 수 있음을 입증한다. 다만, 극단 지연 상황에 대한 과소 추정과 모델 일반화에 대한 추가 검증이 필요하다는 점은 향후 연구 과제로 남는다.
댓글 및 학술 토론
Loading comments...
의견 남기기