이벤트캐스트: LLM 기반 이벤트 지식으로 강화된 하이브리드 전자상거래 수요 예측

이벤트캐스트: LLM 기반 이벤트 지식으로 강화된 하이브리드 전자상거래 수요 예측
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

EventCast는 기존 시계열 모델에 미래 이벤트 정보를 효과적으로 결합하기 위해 LLM을 텍스트 요약 생성에만 활용한다. 비구조화된 프로모션·휴일·인센티브 데이터를 LLM이 해석해 인간이 읽을 수 있는 요약을 만들고, 이를 히스토리 피처와 별도 타워에서 임베딩한 뒤 융합한다. 실험 결과, 이벤트 기간에 MAE가 최대 57 %·MSE가 83 %까지 감소했으며, 산업 현장에 2025년 3월부터 안정적으로 적용되고 있다.

상세 분석

EventCast는 전자상거래 수요 예측에서 “미래에 일어날 이벤트”라는 외생 변수를 어떻게 다루느냐가 핵심이라는 점을 명확히 제시한다. 기존 방법들은 이벤트를 정형화된 카테고리나 수치형 변수로 변환해 모델에 투입하지만, 복합 프로모션·문화적 휴일·지역별 정책 등은 텍스트 형태로만 존재하고, 오탈자·비표준 표현이 많아 전통적인 파싱이 어려웠다. 본 논문은 이러한 비구조 데이터를 LLM에게 직접 질문(pipeline‑prompt)하여 “날짜‑이벤트‑프로모션” 요약을 생성하도록 설계했다. 중요한 점은 LLM의 임베딩을 사용하지 않고, 오직 텍스트 출력만을 토큰화해 학습 가능한 임베딩 레이어에 입력한다는 점이다. 따라서 LLM 자체는 고정(frozen)이며, 추론 비용은 프롬프트 호출 비용 수준에 머문다.

Dual‑tower 구조는 (1) 히스토리 타워: 기존 다변량 시계열(주간 GMV, 주문량, 카테고리별 지표 등)을 Transformer‑like 인코더로 처리하고, (2) 이벤트 타워: LLM이 만든 텍스트 요약을 별도 임베딩 후 간단한 피드‑포워드 레이어로 변환한다. 두 타워의 표현을 Fusion Layer에서 결합해 최종 예측기에 전달한다. 이 설계는 이벤트 정보가 히스토리 잠재공간에 희석되지 않게 하면서, 각 타워가 독립적으로 최적화될 수 있게 해준다.

실증 실험은 4개 국가·160개 지역·10개월 데이터를 사용했으며, “이벤트 없이” 버전과 비교해 MAE 86.9 %·MSE 97.7 % 개선을 기록했다. 특히 플래시 세일·명절·정책 변화와 같은 급격한 변동 구간에서는 산업 베이스라인 대비 MAE 57 %·MSE 83 % 감소라는 실질적 성과를 보였다. 모델은 경량화된 예측 모듈(피드‑포워드) 덕분에 실시간 배치 파이프라인에 쉽게 통합될 수 있었으며, 2025년 3월부터 프로덕션에 배포돼 운영팀이 요약 텍스트를 직접 검증·수정할 수 있는 투명성을 제공한다.

핵심 인사이트는 다음과 같다.

  1. LLM을 “지식 추출기”로 활용함으로써 복잡한 비구조 비즈니스 규칙을 손쉽게 코드화할 수 있다.
  2. 텍스트 출력만 사용해 LLM 파라미터를 고정함으로써 비용·안정성을 확보하고, 프롬프트만 교체하면 새로운 프로모션 유형에도 빠르게 대응한다.
  3. Dual‑tower 설계는 이벤트 신호를 명시적으로 보존하면서도 기존 시계열 모델의 강점을 유지한다.
  4. 해석 가능성이 크게 향상된다. 예측 결과와 함께 LLM이 만든 “날짜‑이벤트 요약”을 제공함으로써 운영자가 원인 분석과 정책 조정을 직관적으로 수행한다.

향후 연구 방향으로는 (a) LLM‑생성 요약의 신뢰성을 자동 평가하는 메트릭, (b) 이벤트 타워에 그래프‑기반 관계 모델을 도입해 다중 이벤트 간 상호작용을 정량화, (c) 멀티‑모달(이미지·영상) 이벤트 데이터와의 통합이 제시될 수 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기