다중과제 가격수요 학습의 인과식별과 정책혼란 해결
초록
이 논문은 소매 가격 결정에서 발생하는 내생성(가격과 미관측 수요 요인의 상관) 문제를 다중과제 학습 환경에 적용한다. 기존의 풀링 회귀·메타러닝은 정책혼란으로 인해 인과적 가격 탄력성을 식별하지 못함을 증명하고, 가격 이력 자체를 조건화하면서 결과를 부분적으로 마스킹하는 “Decision‑Conditioned Masked‑Outcome Meta‑Learning (DCMOML)” 방법을 제안한다. 두 단계의 가격 선택과 무작위 쿼리 설계 하에, 제한된 가격 변동(최소 두 가격)만으로도 과제별 인과 파라미터의 조건부 평균을 일관적으로 추정한다.
상세 분석
본 연구는 다중과제(linear) 수요 모델을 전제로 한다. 각 과제 i는 관측 가능한 컨텍스트 Z_i와 잠재적 이질성 Ω_i에 의해 가격‑수요 관계 D_{ik}=θ_{0i}+θ_{1i}p_{ik}+ε_{ik} 로 표현된다. 여기서 θ_{0i},θ_{1i}는 각각 절편과 가격계수이며, g(Z_i)라는 공유 함수와 Ω_i의 합으로 분해된다. 핵심 난관은 가격 p_{ik}가 정책에 의해 선택되며, 이 정책이 Ω_i와 임의로 상관될 수 있다는 점이다. 저자는 이러한 ‘정책혼란’이 풀링 회귀, 베이지안 계층모델, 최신 메타러닝 손실함수 모두를 왜곡시켜 인과적 추정값이 아닌 정책‑조건부 기대값으로 수렴함을 정리 1‑2 로 증명한다.
식별을 회복하기 위해 저자는 두 가지 설계 원칙을 도입한다. 첫째, 가격 이력 전체를 정보집합에 포함시켜 내생성을 ‘조건화’한다. 이는 가격 자체가 잠재 요인에 대한 신호임을 활용한다는 의미이다. 둘째, 결과를 완전히 노출하면 가격 선택이 결과에 대한 일대일 매핑을 제공해 식별이 사라지므로, 두 후보 가격점(p^{(1)}{iK}, p^{(2)}{iK})에 대한 수요를 마스킹하고, 어느 점이 학습에 사용될지 무작위화한다. 이 ‘두점 마스킹‑쿼리 무작위화’ 설계는 가격 선택 과정에서 발생하는 정보 손실을 최소화하면서도, 가격‑수요 관계를 식별할 수 있는 충분한 변동성을 보존한다.
저자는 ‘가격 적응성 제한’이라는 약한 가정을 제시한다. 이는 최종 가격 p_{iK}가 직전 가격 p_{i,K‑1}와 잠재 파라미터 Θ_i 사이에 선형이 아닌 제한된 의존성을 갖는다는 것으로, 실제 운영에서 가격이 급격히 변하지 않는 상황을 포괄한다. 이 가정 하에 DCMOML은 Θ_i의 조건부 평균 E
댓글 및 학술 토론
Loading comments...
의견 남기기