부분선형 단일지수 모델의 효율적 추정법 연구

부분선형 단일지수 모델의 효율적 추정법 연구

초록

본 논문은 부분선형 단일지수 모델에 대한 두 단계 추정 절차를 제안한다. 첫 단계에서는 단일지수의 비선형 연결함수를 비모수적으로 추정하고, 두 번째 단계에서는 제약 추정 방정식을 이용해 지수 파라미터와 선형 구성요소 파라미터를 동시에 추정한다. 제안된 지수 파라미터 추정량은 기존 방법보다 제한된 분산을 갖는 보다 효율적인 추정량이며, 비모수 연결함수는 최적 수렴 속도를 달성한다. 또한 구조적 오차 분산 추정, 신뢰구간 구성 및 가설 검정 방법을 제공하고, 시뮬레이션과 실제 데이터 분석을 통해 성능을 검증한다. 다중 지수 확장도 간략히 제시한다.

상세 분석

부분선형 단일지수 모델은 반응변수 Y를 비선형 단일지수 함수 g(βᵀX)와 선형 항 Zᵀθ의 합으로 표현한다: Y = g(βᵀX) + Zᵀθ + ε, 여기서 X와 Z는 각각 비선형·선형 설명변수, β와 θ는 파라미터, ε는 평균 0, 분산 σ²인 오차이다. 기존 연구에서는 β와 g를 동시에 추정하기 위해 프로파일 최소제곱이나 스무딩 스플라인을 사용했으나, 제약조건을 고려하지 않아 효율성이 떨어졌다. 본 논문은 두 단계 절차를 채택한다. 첫 단계에서는 β를 임시값 β̂⁰로 고정하고, 로컬 선형 회귀를 이용해 ĝ(·)와 σ̂²를 비모수적으로 추정한다. 두 번째 단계에서는 추정된 ĝ를 이용해 잔차 r_i = Y_i – ĝ(β̂⁰ᵀX_i)를 구하고, 제약 추정 방정식 ∑i r_i X_i = 0 (또는 정규화된 형태) 를 풀어 β를 재추정한다. 이때 β는 ‖β‖=1, 첫 번째 원소가 양수라는 식별조건을 부과한다. 제약 방정식은 Lagrange 승수를 도입해 풀며, 결과적으로 얻어지는 β̂는 기존 프로파일 최소제곱 추정량보다 작은 아시멕틱 분산을 가진다. 이는 제약조건이 추정 과정에서 추가 정보를 제공하기 때문이다. 또한 θ̂는 단순히 선형 회귀식 Zᵀθ = Y – ĝ(β̂ᵀX)의 최소제곱 해로 얻어지며, β̂와 독립적인 asymptotic normality를 만족한다. 비모수 함수 ĝ는 Nadaraya–Watson 커널 추정법을 사용해, 차원 축소된 단일지수 βᵀX에 대해 2차 연속 미분가능성을 가정하면 최적 수렴률 O_p(n^{-2/5})를 달성한다. 논문은 이러한 추정량들의 점근적 분포를 정리하고, Wald-type 검정통계와 신뢰구간을 구성하는 방법을 제시한다. 시뮬레이션에서는 다양한 샘플 크기와 노이즈 수준에서 제안된 β̂가 기존 방법보다 평균 제곱오차가 10~20% 감소함을 보여준다. 실제 데이터 예시(예: 경제 성장 지표와 환경 변수)에서는 모델 적합도가 향상되고, 변수의 유의성을 보다 명확히 판단할 수 있었다. 마지막으로 다중 지수 확장에서는 Y = Σ{k=1}^K g_k(β_kᵀX) + Zᵀθ + ε 형태로 일반화하고, 각 지수에 대해 순차적 혹은 공동 추정 절차를 제안하지만, 이론적 증명은 향후 연구 과제로 남긴다. 전체적으로 이 논문은 제약 추정 방정식을 도입함으로써 부분선형 단일지수 모델의 파라미터 추정 효율성을 크게 향상시켰으며, 실용적인 통계적 추론 도구를 제공한다.