공항 정시 운항 성능 예측과 개선 방안
초록
본 연구는 주요 국제공항의 출발·도착 지연 요인을 분석하고, 로지스틱 회귀, 랜덤 포레스트, 그래디언트 부스팅 모델을 활용해 지연 발생 여부와 지연 시간을 예측한다. 날씨, 활주로 혼잡도, 항공사·편명별 과거 지연률, 보안‑탑승구 이동 시간 등 20여 개 변수를 사용해 분류와 회귀 모델을 구축했으며, 분류에서는 F1‑스코어 0.86, 회귀에서는 MAE 6.3분, RMSE 12.4분을 달성했다. 변수 중요도 분석을 통해 과거 지연 이력과 실시간 날씨가 가장 큰 영향을 미치는 것으로 확인되었으며, 결과는 공항 운영 및 항공사 스케줄링 최적화에 활용될 수 있다.
상세 분석
이 논문은 2019‑2025년 기간 동안 한 국제공항에서 수집한 96만 건 이상의 비행 데이터를 기반으로, 지연 원인과 예측 모델을 체계적으로 탐구한다. 먼저 연구자는 지연을 ‘실제 출발·도착 시각과 예정 시각의 차이(분)’로 정의하고, 15분 이하를 정시(OTP) 기준으로 설정한다. 데이터 전처리 단계에서 취소·운항 중단 항공편과 COVID‑19 팬데믹 초기에 비정상적인 패턴을 보인 구간을 제외해 85만 건 정도의 정제된 샘플을 확보하였다.
모델링은 두 가지 목표로 구분된다. (1) 인과 관계를 밝히는 인퍼런스 모델: 여기서는 실제 날씨, 활주로 이용량 등 ‘즉시’ 영향을 주는 변수를 사용하고, 과거 OTP와 같은 프록시 변수는 배제한다. (2) 실시간 예측 모델: 예측 시점에 사용할 수 있는 예보 날씨와 과거 지연 이력(편명·항공사·게이트별 평균 OTP) 등을 포함한다. 두 목표 모두 분류(정시/지연)와 회귀(지연 시간) 모델을 각각 랜덤 포레스트와 그래디언트 부스팅으로 구현했으며, 로지스틱 회귀는 베이스라인으로 활용하였다.
성능 평가에서는 분류 모델에 대해 매크로·가중 평균 F1‑스코어를, 회귀 모델에 대해 MAE와 RMSE를 사용했다. 랜덤 포레스트 분류 모델은 가중 평균 F1‑스코어 0.86, 그래디언트 부스팅 회귀 모델은 MAE 6.3분, RMSE 12.4분을 기록해 기존 통계 모델 대비 15‑20% 향상을 보였다. 특히 클래스 불균형(정시 항공편 비율이 80% 이상) 문제를 해결하기 위해 가중 평균 방식을 적용했으며, 이는 소수 클래스인 지연 항공편 탐지 능력을 크게 높였다.
변수 중요도 분석(퍼뮤테이션 중요도) 결과, ‘편명·항공사별 과거 지연률’, ‘예보 강수량·눈·얼음 입자’, ‘활주로 혼잡도(동시 이착륙 횟수)’, ‘보안‑게이트 이동 시간’이 상위 5개 변수로 나타났다. 특히 과거 지연률은 다른 변수와 상호작용하면서 지연 전파 효과를 강화하는 것으로 보였으며, 이는 지연이 네트워크 전반에 퍼지는 메커니즘을 시사한다. 날씨 변수는 실시간과 예보 두 버전 모두 높은 중요도를 보였지만, 예보 정확도가 낮은 경우 모델 성능이 급격히 저하되는 경향을 보여, 고품질 기상 예보와의 연계가 필수적임을 강조한다.
운영적 시사점으로는 (1) 고지연 위험이 높은 편·항공사에 대해 사전 스케줄 패딩을 적용하거나, (2) 날씨 악화 시 활주로 배정 및 지상 교통 흐름을 재조정하는 실시간 의사결정 지원 시스템을 구축할 수 있다. 또한, 변수 중요도를 활용해 ‘핵심 지연 요인’에 대한 KPI를 설정하고, 지속적인 모니터링을 통해 정책 효과를 정량화할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기