주택가격 예측의 새로운 통찰
초록
본 논문은 13개 선진국의 35년간 주택가격 변동을 무작위 숲(Random Forest) 모델로 분석한다. 가격 모멘텀, 가격‑임대비, 가계신용 성장 등이 주요 설명변수로 확인되었으며, CPI 인플레이션은 0‑3% 구간에서 가격 상승을 촉진하고 5% 이상에서는 억제한다. 무작위 숲은 동일 변수 10개를 사용한 OLS 대비 RMSE와 MAE를 각각 44%·45% 낮추는 뛰어난 예측력을 보였다. 국가 고정효과는 거의 무시될 정도로 모델이 모든 국가에 일관되게 적용 가능함을 보여준다.
상세 분석
이 연구는 1988년부터 2019년까지 13개 선진국(벨기에, 캐나다, 덴마크, 독일, 일본, 한국, 네덜란드, 뉴질랜드, 노르웨이, 스웨덴, 스위스, 영국, 미국)의 연간 명목 주택가격 지수를 활용해 374개의 국가‑연도 관측치를 구축하였다. 설명변수는 가격 모멘텀(전년 성장률), 가격‑임대비, 가계신용 성장, GDP 성장, CPI 인플레이션, 단기·장기 금리, 주식시장 변동성(VXO), 인구 성장 등 총 10가지이며, 모두 OECD·BIS 등 공신력 있는 데이터베이스에서 수집하였다. 모델링은 (1) 단순 AR(1), (2) 10변수 OLS, (3) Breiman(2001) 무작위 숲을 사용했으며, 무작위 숲은 500개의 트리와 최소 터미널 노드 10을 기본 설정으로 하였다.
인-샘플 결과에서 무작위 숲은 RMSE를 OLS 대비 48.6% 감소, MAE를 53.3% 감소시켰으며, R²는 44%까지 상승했다. 특히 변수 중요도 분석(Shapley 값)에서 가격 모멘텀, 가격‑임대비, 가계신용 성장 순으로 상위 3개가 차지했으며, 인플레이션은 비선형 효과를 보였다. 부분 종속 플롯은 인플레이션이 0‑3% 구간에서 주택가격 상승을 최대화하고, 5% 이상에서는 가격 상승률이 인플레이션률을 하회한다는 역전 현상을 드러냈다. 이는 고인플레이션 상황에서 주택이 인플레이션 헤지 역할을 약화시킨다는 기존 이론과 일치한다.
또한 시간에 따른 변수 중요도 변화 분석에서는 최근 10년 동안 인구 성장과 수익률 곡선(장기 금리)의 상대적 중요도가 상승했으며, 이는 금융시장 통합과 주택을 투자자산으로 보는 경향이 강화된 결과로 해석된다. 국가 고정효과를 포함한 실험에서도 무작위 숲은 국가명을 거의 무시하고 동일한 규칙을 적용했으며, 이는 모델이 구조적 차이보다 공통적인 매크로·금융 요인에 더 민감함을 시사한다.
Robustness 체크로는 변수 선택을 달리하고, 트리 깊이와 샘플 비율을 변동시키는 등 다양한 설정을 테스트했으며, 결과는 전반적으로 무작위 숲의 우수성을 유지했다. 전체적으로 이 논문은 비선형·상호작용을 포착할 수 있는 머신러닝 접근법이 전통적 선형 회귀보다 주택가격 예측에 훨씬 적합함을 실증적으로 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기