전자상거래 행동 예측에 인공신경망 적용 평가

초록

**
본 논문은 소비자 전자상거래 채택을 예측하기 위해 세 가지 인공신경망(ANN) 모델을 구축하고, 동일한 데이터에 대한 로지스틱 회귀 모델과 성능을 비교한다. 결과는 ANN이 약간 높은 정확도를 보였지만, 복잡성 증가와 과적합 위험으로 인해 실용적 이점이 제한적임을 보여준다. 특히 표본이 작고 은닉층 노드 수가 많을 경우 일반화 능력이 크게 저하된다.

상세 분석

**
본 연구는 기존 문헌에서 ANN이 전통적인 통계 모델보다 소비자 구매 행동을 더 정확히 예측한다는 주장과, 반대로 그 효용성을 의심하는 연구 결과 사이의 모순을 해소하고자 한다. 이를 위해 저자는 1,200명의 온라인 설문 응답자를 대상으로 12개의 변수(인구통계학적 특성, 인터넷 사용 경험, 인식된 위험 등)를 수집하고, 이 데이터를 기반으로 세 가지 ANN 구조를 설계하였다. 첫 번째 모델은 은닉층 하나에 5개의 뉴런을, 두 번째 모델은 10개의 뉴런, 세 번째 모델은 15개의 뉴런을 배치했으며, 모두 백프로파게이션 학습을 사용하고 학습률은 0.01로 고정하였다. 비교 대상인 로지스틱 회귀 모델은 동일한 변수들을 입력으로 사용했으며, 다중공선성 검증과 변수 선택을 위해 단계별 회귀를 적용하였다. 성능 평가는 정확도, 정밀도, 재현율, F1‑score 및 ROC‑AUC를 기준으로 수행되었다. 결과적으로 ANN 모델은 로지스틱 회귀에 비해 평균 정확도가 2~3% 정도 상승했지만, AUC 차이는 0.02 이하에 불과했다. 더 중요한 것은 은닉층 뉴런 수가 증가할수록 학습 데이터에 대한 적합도는 높아졌지만 검증 데이터에서 오히려 성능이 감소하는 전형적인 과적합 현상이 관찰되었다. 특히 표본 크기가 300명 이하로 제한된 상황에서 15노드 모델은 훈련 정확도 96%에 반해 검증 정확도가 68%로 급락하였다. 이는 ANN이 작은 표본에 대해 높은 자유도를 갖는 구조적 특성 때문에 일반화 능력이 크게 저하된다는 점을 시사한다. 또한 모델 복잡도와 계산 비용을 고려했을 때, 약간의 정확도 향상만으로는 실무 적용 가치를 정당화하기 어렵다는 결론에 도달한다. 저자는 이러한 결과를 토대로 ANN 적용 시 표본 규모와 은닉층 설계에 대한 엄격한 사전 검증이 필요함을 강조하고, 향후 연구에서는 교차검증, 정규화 기법(L2, 드롭아웃) 및 앙상블 방법을 도입해 일반화 성능을 향상시킬 것을 제안한다.