대조학습으로 다양성 강화한 소매 제품 추천
초록
본 논문은 IKEA 온라인 쇼핑몰에 적용된 기존 시퀀스 기반 추천 파이프라인에 대조학습(contrastive learning)과 정교한 네거티브 샘플링을 도입하여, 인기 아이템에 편중된 장기 꼬리(long‑tail) 문제를 완화하고 카탈로그 커버리지를 크게 향상시키는 방법을 제시한다. 코사인 유사도 손실에 가중 손실 및 교차 엔트로피 손실을 결합하고, 배치 내 네거티브와 상위‑k 하드 네거티브를 활용한 두 가지 샘플링 전략을 비교 실험하였다. 실험 결과, 특히 가중 손실에 100개의 배치 내 네거티브를 적용했을 때 카탈로그 커버리지가 26 % 이상 상승하면서 NDCG@10도 소폭 개선되는 등 정확도와 다양성 모두에서 성능 향상을 확인하였다.
상세 분석
이 연구는 대규모 소매 환경에서 흔히 발생하는 ‘인기 편향(popularity bias)’과 ‘롱테일(Long‑tail)’ 문제를 해결하기 위해 기존의 코사인 유사도 기반 LSTM 시퀀스 모델에 대조학습을 결합한 점이 가장 큰 혁신이다. 기존 파이프라인은 (1) Word2Vec‑스타일 제품 임베딩 생성, (2) 세션 기반 LSTM 모델을 통한 사용자 의도 예측, (3) ANNOY 기반 최근접 이웃 검색으로 구성된다. 여기서 LSTM은 마지막 은닉 상태와 실제 구매(또는 장바구니) 아이템 임베딩 사이의 코사인 유사도를 최대화하는 손실만을 사용했으며, 이는 긍정 샘플에만 초점을 맞추어 네거티브 정보가 전혀 활용되지 않는 구조였다.
논문은 이를 보완하기 위해 세 가지 손실 변형을 제안한다. 첫 번째는 기존 코사인 손실을 그대로 유지하는 베이스라인이다. 두 번째는 ‘가중 손실(weighted loss)’으로, 예측 임베딩과 정답 임베딩 사이의 코사인 유사도를 α로 강화하고, N개의 네거티브 임베딩과의 평균 코사인 유사도를 β로 패널티 부여한다. 여기서 α=2, β=1 로 설정해 정답과 네거티브 사이의 구분을 명확히 한다. 세 번째는 ‘교차 엔트로피 손실(cross‑entropy loss)’으로, 배치 내 모든 네거티브를 클래스 후보로 보고 온도 파라미터 τ=0.05를 적용해 소프트맥스 형태의 대조 손실을 계산한다.
네거티브 샘플링 전략도 두 가지로 설계되었다. ‘인‑배치 네거티브(in‑batch negative) with sampling cap’는 현재 배치에 포함된 다른 양성 아이템을 네거티브로 사용하되, 최대 N개의 샘플만 선택해 계산 비용을 제어한다. ‘Adaptive top‑k in‑batch negative’는 앞선 전략 위에 하드 네거티브 필터링을 추가한다. 즉, 예측 임베딩과 가장 높은 코사인 유사도를 보이는 상위 k개의 아이템을 선택해 학습에 활용함으로써, 정보량이 높은 어려운 네거티브에 집중한다.
실험은 IKEA 네덜란드 데이터와 공개 RetailRocket 데이터 두 가지에서 수행되었다. 평가 지표는 정확도(NDCG@10)와 다양성(카탈로그 커버리지, Gini Coefficient)이다. 결과는 다음과 같다. IKEA 데이터에서는 ‘가중 손실 + 100 인‑배치 네거티브’가 카탈로그 커버리지를 26.4 % 향상시키고, Gini를 6.5 % 낮추며, NDCG@10도 6.4 % 상승시켰다. RetailRocket에서는 ‘가중 손실 + top‑5 in‑batch 네거티브’가 가장 높은 커버리지(0.0476)와 낮은 Gini(0.9849)를 기록했다. 특히, 대조학습을 도입한 모델들은 기존 코사인 손실만 사용한 베이스라인 대비 정확도와 다양성 모두에서 일관된 개선을 보였다.
또한 온라인 A/B 테스트에서도 가중 손실(100 인‑배치 네거티브) 적용 시 카탈로그 커버리지가 2.53 % 상승하고, 다양성 지표가 9.59 % 개선되는 등 실서비스 적용 가능성을 입증했다. 논문은 네거티브 샘플링의 수와 종류가 데이터셋 특성에 따라 최적화될 필요가 있음을 강조하며, 향후 연구에서는 학습 효율성을 높이면서도 정보량이 높은 네거티브를 자동으로 탐색하는 방법을 제안한다.
전체적으로 이 연구는 (1) 임베딩 기반 시퀀스 모델에 대조학습을 자연스럽게 통합, (2) 코사인 손실과 대조 손실을 조합해 정밀한 신호를 제공, (3) 하드 네거티브를 활용한 효율적인 샘플링으로 계산 비용을 최소화하면서도 성능을 극대화한다는 점에서 실무적인 가치가 크다. 특히 대형 리테일 기업이 직면한 ‘인기 편향’ 문제를 데이터‑드리븐하게 완화하고, 장기적인 카탈로그 활용도를 높이는 전략으로서 의미가 깊다.
댓글 및 학술 토론
Loading comments...
의견 남기기