지속가능 개발을 위한 혁신 요인 분석
초록
본 연구는 세계경제포럼(WEF) 글로벌 경쟁력 지수(GCI)의 혁신 지표를 기준으로, 세계은행의 개발 지표(WDI)와 GCI의 비혁신 항목을 활용해 국가별 혁신 수준을 설명·예측하는 데이터‑드리븐 모델을 구축하였다. 인과관계 탐색에는 Granger‑causality와 그룹 라쏘 기반 희소 회귀를, 예측에는 Random Forest를 적용했으며, 기여도 분석과 군집화를 통해 정책적 시사점을 도출하였다.
상세 분석
이 논문은 혁신을 ‘입력(연구·개발, 교육 등)’과 ‘출력(혁신 성과)’으로 구분하고, 기존 지표가 입력에만 치중하는 한계를 극복하고자 한다. 데이터는 2007‑2014년 기간의 GCI와 WDI를 사용했으며, GCI의 12번째 Pillar인 ‘Innovation’ 점수를 혁신의 실제 수준(종속 변수)으로 설정하였다.
인과관계 분석에서는 Granger‑causality 개념을 차용해 과거의 WDI 지표가 미래 혁신 점수를 예측하는지를 검증한다. 시계열 길이 d=3(3년 lag)을 선택하고, 각 국가별로 N개의 WDI 변수와 혁신 점수 시계열을 구성한다. 변수 선택과 파라미터 추정은 Sindhwani & Lozano(2010)의 그룹 라쏘 기반 희소 선형 회귀를 이용했으며, 동일 변수의 여러 lag를 하나의 그룹으로 묶어 전체 시계열이 선택될 경우 해당 lag 모두가 포함되도록 설계하였다. 모델 선택 기준은 Approximate Cp를 사용해 과적합을 방지하였다. 결과적으로 니카라과 사례에서 ‘비혁신 GCI 지표’ 중 몇몇이 혁신 점수에 유의한 인과 효과를 보였으며, 상관관계가 높은 보조 변수들을 함께 제시하였다.
예측 모델링은 Random Forest(RF)를 적용하였다. 입력 변수는 462개의 WDI 지표와 162개의 비혁신 GCI 지표이며, 모두 0 평균·단위 분산으로 표준화하고 결측값은 0으로 대체하였다. RF는 비선형 상호작용을 포착하면서 변수 중요도를 제공한다. 실험 결과, 비혁신 GCI만 사용했을 때 R²=0.93, WDI만 사용했을 때 R²=0.88을 달성해 높은 설명력을 보였다.
기여도 분석에서는 각 국가에 대해 RF의 결정 경로를 추적해 개별 변수의 기여값 cₓᵢ를 계산하고, 이를
댓글 및 학술 토론
Loading comments...
의견 남기기