온라인 쇼핑 행동과 브라우징 습관 대규모 연관성 연구

온라인 쇼핑 행동과 브라우징 습관 대규모 연관성 연구
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 88 637명의 사용자가 Amazon·Walmart에서 구매한 500 000여 개 제품 데이터를 분석하여 일상 웹 브라우징 패턴이 온라인 쇼핑 행동을 예측할 수 있음을 입증한다. 간단한 방문 카테고리와 방문 빈도만으로도 제품 가격, 구매 빈도, 충성도와 같은 핵심 지표를 추정할 수 있었으며, 고가 제품이 반드시 더 많은 구매 노력을 요구하지 않는다는 등 예상외 결과도 도출하였다.

상세 분석

본 논문은 대규모 실사용 로그를 활용한 정량적 연구로서 데이터 수집·전처리·특징 추출·예측 모델링의 전 과정을 체계적으로 제시한다. 먼저 88 637명의 사용자에 대해 6개월간의 HTTP 쿠키와 페이지 뷰 로그를 수집하고, 이를 Amazon·Walmart 구매 기록과 매칭하였다. 브라우징 행동은 크게 10개의 상위 카테고리(뉴스·엔터테인먼트·소셜·쇼핑·여행·교육·건강·금융·게임·기타)와 방문 빈도, 체류 시간, 재방문 주기 등 5가지 메트릭으로 요약하였다. 구매 행동은 총 구매액, 평균 제품 가격, 구매 빈도, 재구매 비율, 브랜드 충성도(특정 쇼핑몰 이용 비중) 등 6가지 지표로 정의하였다.

예측 모델은 로지스틱 회귀, 랜덤 포레스트, 그래디언트 부스팅 트리(GDBT)를 비교했으며, 교차 검증 결과 GDBT가 가장 높은 AUC(0.78)를 기록하였다. 특히 ‘소셜 미디어 방문 비중’이 높을수록 충성도가 낮고, ‘교육·건강 사이트 방문’이 잦을수록 평균 구매액이 높다는 상관관계가 통계적으로 유의미하게 나타났다. 또한 고가 제품군(>200 USD) 구매자는 저가 제품군 구매자와 비교해 페이지 체류 시간 차이가 크지 않아 ‘비용이 높은 제품일수록 더 많은 탐색 노력이 필요하지 않다’는 가설을 반증하였다.

한계점으로는 로그 데이터가 주로 미국 사용자에 국한되어 문화적 편향이 존재하고, 쿠키 기반 추적이 차단된 사용자를 제외했기 때문에 표본 편향 가능성이 제기된다. 또한 프라이버시 보호 차원에서 세부 행동 로그는 익명화되어 있어 미세 행동(클릭 순서·스크롤 깊이)까지는 분석하지 못했다. 향후 연구에서는 다국적 데이터와 심층 행동 시퀀스를 결합해 모델의 일반화 능력을 검증하고, 인과관계 분석을 통해 마케팅 전략에 직접 적용 가능한 인사이트를 도출할 필요가 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기