지배 국가를 활용한 석유 소비 예측
초록
본 논문은 OECD와 GVAR 표본에서 소수의 지배 국가가 지역 석유 수요 변동을 주도한다는 가설을 검증하고, LASSO와 OCMT 두 가지 변수 선택 기법으로 고차원 집중 행렬을 추정한다. 열 노름 비율과 경제적 제한을 결합해 지배 국가를 선정한 뒤, 이들을 회귀 변수로 포함시켜 전통적인 AR 모델 및 국가별 LASSO 대비 예측 정확도를 크게 향상시켰다. 미국은 전 세계적 지배 국가로, 프랑스와 일본은 각각 유럽·아시아 지역 허브로 확인되었다.
상세 분석
논문은 먼저 N개의 국가·지역을 대상으로 하는 패널 모델 x_it = Σ_{j≠i} b_ij x_jt + u_it 를 설정하고, B 행렬의 희소성을 가정한다. 지배 국가(j∈Γ(N_d))는 N→∞ 일 때 Σ_i |b_ij|/N 이 양의 상수 K 로 수렴하는 국가로 정의되며, 비지배 국가는 유한한 상한을 가진다. 이를 실증적으로 식별하기 위해 두 단계의 고차원 변수 선택을 적용한다. 첫 단계에서는 각 국가 i에 대해 LASSO(엄격한 페널티 λ_i와 가중치 ψ_ij)와 OCMT(개별 회귀 후 다중 검정 보정)를 별도로 수행해 비제로 계수를 추정한다. LASSO는 전체 변수 집합에 대한 공동 페널티를 부과해 과적합을 방지하고, OCMT는 각 변수의 개별 t‑통계량을 검정해 FWER 혹은 FDR을 제어한다. 두 방법의 선택 결과를 OR 연산으로 결합해 비대칭 행렬 ˆB를 만든 뒤, ˆD(대각선에 1/σ̂_i)와 결합해 비대칭 집중 행렬 ˆκ = ˆD(I−ˆB)ˆD 를 얻는다.
다음으로 열 노름 ‖ˆκ(s)‖을 내림차순으로 정렬하고, 연속된 노름 비율 ‖ˆκ(s)‖/‖ˆκ(s+1)‖이 최대가 되는 s를 N_d̂ 로 정의한다. 이는 열 노름이 급격히 감소하는 지점을 찾아 지배 국가의 수를 데이터‑드리븐으로 결정한다. 그러나 작은 잔차 분산을 가진 비지배 국가가 인위적으로 높은 대각 원소를 갖는 문제를 보완하기 위해 R_i = |ˆκ_ii|·‖ˆκ(i)‖⁻¹ 를 계산하고, 사전 설정된 임계값 R 이상인 경우 후보에서 제외한다. 또한 연결성 기준으로 중앙값보다 적은 링크를 가진 국가도 배제한다. 이러한 다중 필터링은 ‘가짜 지배’ 현상을 최소화한다.
선정된 지배 국가를 회귀 변수로 포함한 확장 VAR 모델을 구축하고, 1‑step‑ahead와 4‑step‑ahead 예측을 수행한다. 베이스라인으로는 각 국가별 자체 AR(p) 모델과 국가별 LASSO(자기 변수와 전체 변수 중 선택) 모델을 사용한다. 실험 결과, 미국이 전 세계적 지배 국가로, 프랑스와 일본이 각각 유럽·아시아 허브 역할을 함을 확인했다. 특히 글로벌 변동성이 높아지는 2008‑2009년 금융 위기와 2020‑2021년 코로나 팬데믹 기간에 제안 모델이 AR 및 LASSO 대비 평균 절대 오차(MAE)와 루트 평균 제곱 오차(RMSE)에서 10‑15% 정도의 개선을 보였다. 구조적 VAR 분석을 통해 일본·한국이 아시아 충격을 전파하는 주요 경로임을 추가로 입증하였다.
이 논문의 주요 기여는 (1) 고차원 네트워크 구조를 변수 선택과 집중 행렬 추정에 결합한 새로운 프레임워크, (2) 두 상이한 선택 기법(LASSO, OCMT)의 보완적 사용을 통해 선택 안정성을 강화, (3) 경제적 제한과 연결성 필터링을 도입해 ‘의사‑지배’ 문제를 해결, (4) 석유 수요 예측에 실질적인 성과 향상을 제공함으로써 정책 입안자와 에너지 기업에 실용적 인사이트를 제공한다는 점이다.
댓글 및 학술 토론
Loading comments...
의견 남기기