잠재 구조를 활용한 사회적 상호작용 모델의 이질성 추정
초록
본 논문은 그룹 고정효과와 기울기 이질성을 동시에 허용하는 이진 선택 사회적 상호작용 모델을 제안한다. Classifier‑Lasso와 Nested Pseudo‑Likelihood(NPL)를 결합한 3단계 추정 절차를 설계하고, 군집 수와 구성원을 일관적으로 식별한다. 또한 고정효과로 인한 편향을 파라메트릭 부트스트랩으로 보정하여 asymptotic 유효성을 증명한다. 시뮬레이션과 Add Health 데이터 실증을 통해 두 개의 잠재 군집을 발견하고, 한 군집에서만 의미 있는 동료 효과가 존재함을 확인한다.
상세 분석
이 논문은 사회적 상호작용 모델에 내재된 이질성을 다루는 데 두 가지 핵심 난제를 해결한다. 첫 번째는 그룹별 파라미터가 완전 동질인지 완전 이질인지 결정하기 어려운 상황에서, 잠재 군집 구조를 가정함으로써 군집 내에서는 파라미터가 동일하고 군집 간에는 차이가 존재하도록 모델링한다는 점이다. 이를 위해 저자들은 기존의 C‑Lasso(Classifier‑Lasso) 알고리즘을 변형하여, 각 그룹의 추정된 조건부 선택 확률(CCP)을 입력으로 사용하고, 군집 수와 군집 소속을 동시에 추정한다. C‑Lasso는 다중 패널 구조에서 군집을 식별하기 위한 패널 라쏘와 유사하지만, 여기서는 비선형 로그우도와 CCP 업데이트가 결합된 비볼록 최적화 문제를 연속적인 볼록 서브문제로 근사한다.
두 번째 난제는 고정효과가 존재하는 이진 선택 게임에서 발생하는 ‘incidental parameter bias’이다. 전통적인 NPL(Nested Pseudo‑Likelihood) 알고리즘은 CCP를 반복적으로 업데이트하면서 파라미터를 추정하지만, 고정효과가 다수 존재하면 추정량에 1/그룹 크기 수준의 편향이 발생한다. 저자들은 이 편향을 정확히 분석하고, 파라메트릭 부트스트랩을 이용해 편향을 제거한다. 구체적으로, 원본 데이터에서 추정된 파라미터와 고정효과를 이용해 새로운 샘플을 생성하고, 각 부트스트랩 샘플에 대해 동일한 NPL‑C‑Lasso 절차를 수행한다. 부트스트랩 분포의 평균을 원본 추정량에서 차감함으로써 일관적이고 asymptotically 정상적인 추정량을 얻는다.
이론적 기여는 다음과 같다. (1) 군집 일관성 정리를 통해, 그룹 수와 군집 크기가 동시에 무한으로 갈 때 C‑Lasso가 실제 군집 구조를 정확히 복원한다는 것을 증명한다. (2) NPL 단계에서 얻은 사전 추정량을 C‑Lasso에 투입함으로써 연산 복잡도를 크게 낮추고, NPL‑C‑Lasso 순환이 수렴함을 보인다. (3) 고정효과 편향에 대한 1차 및 2차 근사식을 도출하고, 부트스트랩이 이 편향을 일관적으로 보정한다는 점을 asymptotic 수준에서 검증한다.
실증 부분에서는 Add Health 데이터(청소년의 위험 행동)를 사용해 100여 개 학교를 2개의 잠재 군집으로 구분한다. 한 군집(주로 대규모 학교)에서는 동료 효과(동료 위험 행동 비율)가 통계적으로 유의미하게 나타났으며, 다른 군집에서는 효과가 미미했다. 이는 기존 연구가 전체 표본에 대해 동질성을 가정했을 때 놓칠 수 있는 중요한 이질성을 드러낸다.
전반적으로 이 논문은 사회적 상호작용 모델에 잠재 군집 구조를 도입하고, 고정효과 편향을 부트스트랩으로 보정하는 통합 프레임워크를 제공한다. 이는 대규모 네트워크 데이터에서 이질적인 동료 효과를 식별하고, 정책 설계 시 대상 집단을 정밀하게 구분하는 데 실용적인 도구가 될 것이다.
댓글 및 학술 토론
Loading comments...
의견 남기기