Normalizations and misspecification in skill formation models

📝 Abstract
An important class of structural models studies the determinants of skill formation and the optimal timing of interventions. In this paper, I provide new identification results for these models and investigate the effects of seemingly innocuous scale and location restrictions on parameters of interest. To do so, I first characterize the identified set of all parameters without these additional restrictions and show that important policy-relevant parameters are point identified under weaker assumptions than commonly used in the literature. The implications of imposing standard scale and location restrictions depend on how the model is specified, but they generally impact the interpretation of parameters and may affect counterfactuals. Importantly, with the popular CES production function, commonly used scale restrictions fix identified parameters and lead to misspecification. Consequently, simply changing the units of measurements of observed variables might yield ineffective investment strategies and misleading policy recommendations. I show how existing estimators can easily be adapted to solve these issues. As a byproduct, this paper also presents a general and formal definition of when restrictions are truly normalizations.
💡 Analysis
An important class of structural models studies the determinants of skill formation and the optimal timing of interventions. In this paper, I provide new identification results for these models and investigate the effects of seemingly innocuous scale and location restrictions on parameters of interest. To do so, I first characterize the identified set of all parameters without these additional restrictions and show that important policy-relevant parameters are point identified under weaker assumptions than commonly used in the literature. The implications of imposing standard scale and location restrictions depend on how the model is specified, but they generally impact the interpretation of parameters and may affect counterfactuals. Importantly, with the popular CES production function, commonly used scale restrictions fix identified parameters and lead to misspecification. Consequently, simply changing the units of measurements of observed variables might yield ineffective investment strategies and misleading policy recommendations. I show how existing estimators can easily be adapted to solve these issues. As a byproduct, this paper also presents a general and formal definition of when restrictions are truly normalizations.
📄 Content
구조적 모델 중에서도 특히 기술 형성(skill formation)의 결정 요인과 개입(intervention)의 최적 시점(optimal timing)을 분석하는 분야는 정책 설계와 인적 자본 축적 메커니즘을 이해하는 데 핵심적인 역할을 한다.
본 논문에서는 이러한 구조적 모델에 대해 새로운 식별(identification) 결과를 제시함과 동시에, 겉으로 보기에는 별다른 영향을 미치지 않을 것처럼 보이는 규모(scale)와 위치(location) 제한이 실제로는 연구자가 관심을 가지고 추정하고자 하는 주요 매개변수(parameters of interest)에 어떠한 영향을 미치는지를 체계적으로 조사한다.
이를 위해 먼저 추가적인 제한이 전혀 부과되지 않은 상태에서 모델이 내포하고 있는 모든 매개변수들의 **식별 집합(identified set)**을 명확히 규정한다. 이 과정에서 우리는 기존 문헌에서 흔히 가정하고 있는 강한(strong) 가정보다 보다 약한(weaker) 가정만을 전제로 하더라도, 정책 입안자들에게 직접적인 의미를 갖는 **중요한 정책 관련 매개변수들(important policy‑relevant parameters)**이 **점식별(point identified)**될 수 있음을 증명한다. 즉, 이전 연구들이 필요하다고 여겼던 일부 제한조건은 실제로는 식별 가능성을 확보하는 데 필수적이지 않으며, 오히려 불필요하게 모델을 복잡하게 만들 수 있다는 점을 보여준다.
다음으로 표준적인 규모와 위치 제한을 강제했을 때 그 함의가 모델이 어떻게 구체화되는가에 따라 달라지는지를 분석한다. 일반적인 경우, 이러한 제한은 **매개변수의 해석(interpretation)**에 직접적인 영향을 미치며, 궁극적으로 반사실(counterfactual) 분석—예를 들어, 특정 정책이 시행되었을 경우의 예상 효과를 시뮬레이션하는 과정—에도 중요한 변화를 초래할 수 있다.
특히 가장 널리 사용되는 CES(Constant Elasticity of Substitution) 생산함수를 예로 들면, 문헌에서 흔히 적용되는 **규모 제한(scale restriction)**이 실제로는 **식별된 매개변수들을 고정(fix)**시켜 버려 **모델 자체를 잘못 지정(misspecify)**하게 만든다는 점을 강조한다. 이러한 잘못된 지정은 **관측 변수(observed variables)의 측정 단위(unit of measurement)**만을 단순히 바꾸는 것만으로도 **비효율적인 투자 전략(ineffective investment strategies)**을 도출하게 만들고, 결과적으로 **오해를 불러일으키는 정책 권고(misleading policy recommendations)**를 낳을 위험이 있다.
본 논문은 이러한 위험을 최소화하기 위해 **기존에 널리 사용되어 온 추정량(existing estimators)**을 **쉽게 수정(adapt)**하여 제한조건에 의해 발생하는 식별 문제와 모델 오규격화 문제를 해결할 수 있는 구체적인 방법론을 제시한다. 구체적으로는 제한조건을 완화하거나, 대체적인 정규화(normalization) 방식을 도입함으로써 추정 과정에서 발생할 수 있는 편향(bias)과 불확실성(uncertainty)을 감소시키는 절차를 단계별로 설명한다.
마지막으로, 부수적인 기여로서 본 논문은 ‘제한이 진정한 정규화(normalization)인 경우’를 일반적이고 형식적인 정의로 제시한다. 이 정의는 제한조건이 단순히 식별을 돕는 도구(tool)인지, 아니면 모델 자체의 구조적 특성을 변형시키는 근본적인 변환(transformation)인지를 구분하는 기준을 제공한다. 따라서 연구자는 제한을 적용할 때 그것이 실제로는 정규화 역할을 하는지, 혹은 모델의 실질적인 내용에 영향을 미치는지를 명확히 판단할 수 있게 된다.
요약하면, 본 연구는 (1) 추가적인 규모·위치 제한 없이도 주요 매개변수가 점식별될 수 있음을 이론적으로 증명하고, (2) 흔히 사용되는 CES 생산함수와 같은 구체적 모델에 제한을 부과했을 때 발생할 수 있는 식별 오류와 모델 오규격화를 경고하며, (3) 기존 추정 방법을 간단히 수정함으로써 이러한 문제들을 실질적으로 해결할 수 있는 실용적인 방안을 제시한다. 더불어, 제한조건과 정규화의 차이를 명확히 구분하는 형식적 정의를 제공함으로써 향후 구조적 모델링 연구에 있어 제한조건을 어떻게 설계하고 적용해야 하는가에 대한 이론적 토대를 마련한다.
이와 같은 일련의 분석과 제안은 정책 입안자, 학계 연구자, 그리고 실무자가 구조적 모델을 활용할 때 보다 정확하고 신뢰할 수 있는 결과를 도출하도록 돕는 동시에, 잘못된 단위 변환이나 부적절한 제한 적용으로 인한 정책 오류를 방지하는 데 기여할 것이다.