빛과 전기의 미래를 예측하는 경량 공변량 강화 모델
초록
LightGTS‑Cov는 1백만 파라미터 규모의 경량 시계열 기반 모델 LightGTS에 약 10만 파라미터 MLP 플러그인을 추가해 과거·미래 공변량을 효율적으로 결합한 모델이다. 토큰 수준에서 시간 정렬된 공변량을 두 단계 MLP로 융합하고, 기존 디코더 출력을 잔차 방식으로 보정한다. 전력 가격 및 태양광 발전 데이터에서 기존 LightGTS와 경쟁 모델을 능가하며, 실제 산업 현장 배치에서도 안정적인 성능을 입증한다.
상세 분석
LightGTS‑Cov는 기존 LightGTS의 핵심 설계인 ‘주기‑인식 토크나이제이션’과 ‘병렬 비자기회귀 디코딩’ 구조를 그대로 유지하면서, 공변량 통합을 위한 최소한의 구조적 변화를 도입한다. 구체적으로, 과거 공변량 X_past은 동일한 주기‑패치 방식을 적용해 토큰 Z_past을 생성하고, 미래에 알려진 공변량 Y_future는 패치 길이 P*에 따라 토큰 f 로 임베딩한다. 두 종류의 토큰은 각각 디코더 출력 Z_target과 변수 차원에서 결합된 뒤, Flatten 과정을 거쳐 1차원 벡터 u(1)_j 로 변환된다. 여기서 MLP_past가 토큰‑별로 비선형 혼합을 수행해 중간 토큰 h_j 를 만든다. 이어서 MLP_future가 미래 공변량 토큰 f와 h_j 를 결합해 최종 공변량‑보정 토큰 R_tile을 생성한다. 마지막으로 공유 출력 헤드가 Z_target와 R_tile을 각각 투사하고, 두 결과를 합산해 최종 예측 ĤY_target를 만든다.
이 설계는 세 가지 주요 장점을 제공한다. 첫째, 백본 구조를 전혀 변경하지 않으므로 사전 학습된 LightGTS 가중치를 그대로 활용할 수 있어 파인튜닝 비용이 최소화된다. 둘째, 토큰‑레벨 정렬을 통해 시간적 일관성을 보장함으로써, 특히 장기 예측 시 미래 공변량이 제공될 경우 시계열 드리프트를 크게 억제한다. 셋째, 파라미터 오버헤드가 전체 모델의 약 10 % 수준에 불과해 실시간 추론과 산업용 배포에 적합하다.
실험에서는 전력 가격(예: ISO‑NE, PJM)과 재생에너지(태양광 발전) 데이터셋을 사용해 LightGTS‑Cov가 LightGTS 대비 평균 MAE 및 RMSE 지표에서 5 %~12 % 향상을 달성했으며, TFT, TiDE, NBEATS‑Cov 등 기존 공변량‑인식 모델과도 경쟁력 있는 성능을 보였다. 특히 미래 공변량이 없는 경우에도 기존 LightGTS보다 우수한 결과를 유지했으며, 미래 공변량을 활용했을 때는 성능 격차가 더욱 확대되었다.
산업 현장 적용 사례로는(1) 현장 기상 관측과 수치예보를 결합한 다일 태양광 발전 장기 예측, (2) 날씨·발전 계획이 사전 공개되는 전력 시장의 일일 가격 예측을 들 수 있다. 두 경우 모두 배포 후 운영 로그에서 예측 오류가 안정적으로 감소하고, 시스템 응답 시간이 30 ms 이하로 유지되는 등 실시간 서비스 요건을 충족했다.
한계점으로는(1) 공변량 토큰화 시 패치 길이 P* 선택이 데이터 특성에 민감할 수 있어 자동 튜닝이 필요하고, (2) 현재는 연속형 공변량에 초점을 맞추었으나 범주형·텍스트형 공변량에 대한 확장성이 아직 검증되지 않았다. 향후 연구에서는 다중 모달리티 공변량을 위한 공통 임베딩 레이어와, 동적 토큰 길이 조절 메커니즘을 도입해 모델 일반성을 높이는 방향을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기