AI 기반 수요 분석의 새로운 지평
초록
본 논문은 Amazon 장난감 자동차 데이터를 활용해 텍스트·이미지·표형식 변수를 결합한 멀티모달 임베딩을 구축하고, 이를 가격·수량 예측 및 가격탄력성 추정에 적용한다. 사전학습된 트랜스포머 모델을 자기지도학습과 인과관계에 맞춘 파인튜닝을 거쳐 얻은 임베딩이 기존 표형식 변수만 사용할 때보다 예측 정확도를 크게 높이며, 가격탄력성의 이질성을 정교하게 포착한다는 점을 실증적으로 보여준다.
상세 분석
이 연구는 전통적인 수요 분석이 직면한 ‘특성 요약의 한계’를 AI 기반 멀티모달 임베딩으로 극복한다는 점에서 학술적·실무적 의의를 가진다. 먼저 저자들은 Amazon.com에서 수집한 7,226개의 장난감 자동차에 대해 텍스트(제품 설명), 이미지(첫 번째 사진), 그리고 카테고리·리뷰 수·평점·라이트닝 딜 여부 등 표형식 변수를 확보한다. 텍스트는 RoBERTa·LLaMA, 이미지는 BEiT, 표형식은 SAINT 모델을 이용해 각각 768차원 임베딩을 추출하고, 이를 256차원으로 축소한 뒤 정규화한다. 핵심은 이 임베딩을 ‘가격·수량 신호 예측’이라는 인과적 목적에 맞춰 파인튜닝한다는 점이다. 파인튜닝 과정은 자기지도학습(마스크 복원)으로 사전학습된 표현을 유지하면서, 가격·수량 예측 손실을 최소화하도록 전체 네트워크를 미세조정한다. 이렇게 얻은 임베딩은 ‘정규화된 오쏘고날 머신러닝(orthogonal ML)’ 프레임워크에 삽입돼, 가격탄력성 추정 시 교란변수와 효과조정변수 역할을 동시에 수행한다.
예측 성능 측면에서, 멀티모달 임베딩을 포함한 모델은 단순 표형식 회귀 대비 RMSE가 15% 이상 감소하고, R²가 0.68에서 0.81로 상승한다. 특히 이미지 정보를 추가했을 때 브랜드·디자인 차이가 크게 반영되어, 동일 텍스트라도 시각적 차이에 따른 수요 차이를 포착한다는 점이 강조된다. 인과 추정에서는 전통적인 횡단면 회귀가 과소평가하는 가격탄력성(≈‑0.8)을 멀티모달 모델이 2배 이상(≈‑1.7)으로 복원한다. 더 나아가, 임베딩을 효과조정변수로 활용한 이질성 분석은 ‘고가·고인기 제품’군에서 탄력성이 크게 감소하고, ‘저가·신규 출시’군에서는 탄력성이 급격히 상승한다는 구체적 패턴을 드러낸다.
이러한 결과는 두 가지 중요한 시사점을 제공한다. 첫째, 멀티모달 임베딩은 기존 변수로는 포착하기 어려운 ‘시각·텍스트·정성적’ 특성을 정량화함으로써 수요 예측과 인과 추정 모두에서 성능 향상을 가능하게 한다. 둘째, 인과 목적에 맞춘 파인튜닝은 임베딩이 교란변수와 효과조정변수 역할을 동시에 수행하도록 설계될 수 있음을 보여준다. 다만, 판매량이 아닌 역순위( sales rank )를 양적 변수로 대체한 점은 파라미터 추정에 불확실성을 남기며, 파레토 분포 가정에 대한 민감도 검증이 추가로 필요하다. 또한, 데이터가 장난감 자동차라는 좁은 도메인에 국한돼 있어, 다른 카테고리나 시장에 대한 일반화 가능성은 추후 연구에서 검증해야 할 과제이다.
댓글 및 학술 토론
Loading comments...
의견 남기기