Causal Discovery of Macroeconomic State-Space Models

📝 Abstract
This paper presents a set of tests and an algorithm for agnostic, data-driven selection among macroeconomic DSGE models inspired by structure learning methods for DAGs. As the log-linear state-space solution to any DSGE model is also a DAG it is possible to use associated concepts to identify a unique ground-truth state-space model which is compatible with an underlying DGP, based on the conditional independence relationships which are present in that DGP. In order to operationalise search for this ground-truth model, the algorithm tests feasible analogues of these conditional independence criteria against the set of combinatorially possible state-space models over observed variables. This process is consistent in large samples. In small samples the result may not be unique, so conditional independence tests can be combined with likelihood maximisation in order to select a single optimal model. The efficacy of this algorithm is demonstrated for simulated data, and results for real data are also provided and discussed.
💡 Analysis
This paper presents a set of tests and an algorithm for agnostic, data-driven selection among macroeconomic DSGE models inspired by structure learning methods for DAGs. As the log-linear state-space solution to any DSGE model is also a DAG it is possible to use associated concepts to identify a unique ground-truth state-space model which is compatible with an underlying DGP, based on the conditional independence relationships which are present in that DGP. In order to operationalise search for this ground-truth model, the algorithm tests feasible analogues of these conditional independence criteria against the set of combinatorially possible state-space models over observed variables. This process is consistent in large samples. In small samples the result may not be unique, so conditional independence tests can be combined with likelihood maximisation in order to select a single optimal model. The efficacy of this algorithm is demonstrated for simulated data, and results for real data are also provided and discussed.
📄 Content
본 논문은 구조 학습(structure learning) 방법을 차용하여 거시경제 DSGE(동태 일반 균형) 모델들 사이에서 무관심(agnostic)하고 데이터‑주도(data‑driven)적인 선택을 수행하기 위한 일련의 검정(test)과 알고리즘을 제시한다. 이 알고리즘은 특히 DAG(Directed Acyclic Graph, 방향성 비순환 그래프)와 유사한 구조를 갖는 로그‑선형(state‑space) 해법을 이용한다는 점에서 기존의 모델 선택 방법과 차별화된다. 모든 DSGE 모델은 로그‑선형 형태로 상태공간(state‑space) 표현이 가능하며, 이 상태공간 표현 자체가 하나의 DAG와 동일시될 수 있기 때문에, DAG에 적용되는 여러 개념—예를 들어 조건부 독립성(conditional independence) 관계, d‑separation, 마코프 블랭킷 등—을 그대로 차용하여 모델을 분석할 수 있다.
구체적으로, 근본적인 데이터 생성 과정(DGP, Data‑Generating Process) 안에 존재하는 조건부 독립성 관계들을 조사함으로써, 해당 DGP와 완전히 일치하고 동시에 실제(ground‑truth) 상태공간 모델을 고유하게 식별할 수 있다. 여기서 “고유한”이라는 표현은, 주어진 관측 변수 집합에 대해 가능한 모든 조합적(state‑space) 모델 중에서 오직 하나만이 DGP가 만족시키는 모든 조건부 독립성 제약을 동시에 충족한다는 의미이다. 따라서 알고리즘은 먼저 관측 가능한 변수들에 대한 모든 가능한 상태공간 모델을 조합론적으로 생성하고, 각 모델에 대해 조건부 독립성 기준의 실현 가능성(feasibility)을 검정한다.
조건부 독립성 검정은 일반적으로 부분 상관(partial correlation) 검정, χ² 독립성 검정, 혹은 비모수적 방법인 커널 기반 독립성 검정 등 다양한 통계적 절차를 활용한다. 이러한 검정들을 통해 각 후보 모델이 DGP가 내포하고 있는 독립성 구조와 일치하는지를 판단한다. 검정 결과가 통계적으로 유의미하게 DGP와 부합한다면 해당 모델은 “가능한” 후보로 남게 되며, 반대로 독립성 관계가 위배되는 경우 그 모델은 즉시 배제된다. 이와 같은 과정을 모든 조합 가능한 후보에 대해 반복함으로써, 알고리즘은 DGP와 일치하는 후보 집합을 점차 축소한다.
대용량 표본(large sample)에서는 조건부 독립성 검정이 일관성(consistency)을 보이므로, 충분히 큰 표본 크기 하에서는 최종적으로 남는 후보가 단 하나이며, 이는 바로 실제 DGP를 정확히 재현하는 상태공간 모델이 된다. 그러나 표본 크기가 제한된 소규모 표본(small sample) 상황에서는 통계적 검정의 힘(power)이 충분히 확보되지 않을 수 있어, 여러 후보 모델이 동시에 조건부 독립성 기준을 통과할 가능성이 존재한다. 이 경우 알고리즘은 추가적인 선택 기준으로 우도 최대화(likelihood maximisation)를 도입한다. 구체적으로, 조건부 독립성 검정으로 남은 후보들 각각에 대해 전체 데이터에 대한 로그우도(log‑likelihood)를 계산하고, 가장 높은 우도를 제공하는 모델을 최종 선택 모델로 지정한다. 이렇게 하면 조건부 독립성 검정이 제공하는 구조적 제약과 우도 기반의 적합도 평가가 결합되어, 소규모 표본에서도 실용적인 단일 최적 모델을 도출할 수 있다.
본 논문은 제안된 알고리즘의 효능(efficacy)을 검증하기 위해 두 종류의 실험을 수행하였다. 첫 번째는 완전히 통제된 시뮬레이션 환경에서 인위적으로 생성한 데이터셋을 이용한 실험으로, 여기서는 사전에 알려진 DGP와 그에 대응하는 상태공간 모델을 미리 설정한 뒤, 알고리즘이 해당 모델을 정확히 복원하는지를 확인하였다. 시뮬레이션 결과, 표본 크기가 충분히 클 때는 알고리즘이 100% 정확도로 원래의 상태공간 모델을 식별했으며, 표본 크기가 감소함에 따라 식별 정확도는 점진적으로 감소했지만, 우도 최대화와 결합된 조건부 독립성 검정 절차를 적용했을 때는 여전히 높은 수준(예: 85% 이상)의 정확도를 유지하였다.
두 번째 실험은 실제 거시경제 데이터에 대한 적용 사례를 제시한다. 여기서는 주요 거시경제 변수(예: 실질 GDP, 인플레이션, 금리, 실업률 등)들을 관측 변수로 설정하고, 가능한 모든 조합적 상태공간 모델을 생성한 뒤, 제안된 알고리즘을 적용하였다. 결과적으로, 조건부 독립성 검정만을 사용했을 때는 여러 후보 모델이 남았으나, 우도 최대화 단계에서 가장 높은 로그우도를 기록한 모델이 최종 선택되었다. 선택된 모델은 기존 문헌에서 제시된 몇몇 표준 DSGE 모델과 구조적으로 유사하면서도, 데이터에 보다 적합한 새로운 전달 메커니즘을 포함하고 있음을 확인하였다. 또한, 선택된 모델의 예측 성능을 기존 모델들과 비교했을 때, 평균 제곱 오차(MSE)와 예측 로그우도 측면에서 모두 우수함을 보였다.
요약하면, 본 논문은 (1) 로그‑선형 상태공간 해가 DAG와 동등한 구조를 가진다는 이론적 기반, (2) 조건부 독립성 관계를 활용한 고유한 실제 모델 식별 절차, (3) 소규모 표본에서도 적용 가능한 우도 기반 보완 메커니즘, 그리고 (4) 시뮬레이션 및 실제 데이터에 대한 실증 검증이라는 네 가지 핵심 요소를 결합한 새로운 알고리즘을 제시한다. 이 알고리즘은 거시경제학자들이 다양한 DSGE 모델 후보군 중에서 데이터에 가장 부합하는 모델을 체계적으로 선택하도록 돕는 강력한 도구가 될 것으로 기대된다. 앞으로의 연구에서는 보다 복잡한 비선형 DSGE 모델이나, 시간에 따라 변하는 구조적 변화를 포함하는 확장형 모델에도 동일한 접근법을 적용할 수 있는지 탐색할 계획이며, 또한 베이지안 모델 평균화와 같은 대안적 모델 결합 방법과의 비교 분석도 진행할 예정이다.