LLM과 GCN 기반 전자상거래 결제 사기 탐지 및 위험 평가

초록

본 연구는 대규모 전자상거래 결제 데이터를 그래프 구조로 변환하고, GPT‑4o·Tabformer 로부터 추출한 의미적 특성과 그래프 컨볼루션 네트워크(GCN) 를 결합한 하이브리드 모델을 제안한다. 2,840,000 건의 거래(사기 6,000건 이하) 를 대상으로 실험한 결과, 정확도 0.98, 정밀도·재현율 모두 높은 균형을 달성하며 실시간 사기 탐지에 적합함을 입증한다.

상세 요약

이 논문은 전통적인 규칙 기반 혹은 단순 머신러닝 방식이 거래 데이터의 복잡한 관계성을 포착하지 못한다는 점을 지적하고, 이를 해결하기 위해 두 가지 최신 기술을 융합하였다. 첫 번째는 대규모 언어 모델(LLM)인 GPT‑4o와 Tabformer를 활용해 거래 레코드의 텍스트·표 형식 메타데이터에서 의미론적 임베딩을 추출하는 단계이다. 이 과정에서 거래 설명, 사용자 리뷰, 결제 메모 등 비정형 정보를 정량화함으로써 기존 피처 엔지니어링이 놓치기 쉬운 미묘한 사기 신호를 포착한다. 두 번째는 거래 참여자(소비자·상점)를 노드, 거래 자체를 엣지로 하는 이종 그래프를 구성하고, Graph Convolutional Network(GCN)를 적용해 구조적 패턴을 학습한다. GCN는 이웃 노드의 특성을 집계해 노드 레벨 표현을 업데이트하므로, 동일한 사기 조직에 속한 여러 계정이나 연관된 상점 간의 협조적 행동을 효과적으로 탐지한다.

데이터셋은 14일간 수집된 2,840,000 건의 거래로, 전체 사기 건수는 6,000건 미만으로 심각한 클래스 불균형을 보인다. 논문은 이 문제를 해결하기 위해 (1) 가중치 기반 교차 엔트로피 손실, (2) SMOTE‑like 오버샘플링, (3) 그래프 레벨의 언더샘플링을 조합한 다중 샘플링 전략을 적용하였다. 또한, LLM‑추출 피처와 GCN‑학습 피처를 단순 연결(concatenation) 후 다층 퍼셉트론(MLP)으로 최종 분류기를 구성함으로써 두 정보 흐름을 효율적으로 통합한다.

실험 결과는 베이스라인 모델(전통 XGBoost, 단일 GCN, LLM‑단독) 대비 정확도 0.98, 정밀도 0.96, 재현율 0.94, F1 0.95를 기록한다. 특히, ablation study에서 LLM 피처를 제외하면 재현율이 8%p 급감하고, GCN를 제외하면 정밀도가 7%p 감소하는 등 두 모듈이 상호 보완적임을 확인한다. 모델의 추론 시간은 평균 12ms로, 실시간 결제 흐름에 적용 가능함을 시사한다.

하지만 몇 가지 한계도 존재한다. 첫째, 데이터가 미국 내 2,000명 소비자와 30개 상점에 국한돼 있어 국제적 다양성을 반영하지 못한다. 둘째, GPT‑4o API 호출 비용 및 latency가 실제 운영 환경에서 비용 효율성을 저해할 가능성이 있다. 셋째, 그래프 구축 시 거래 외에 사용자 행동 로그(클릭, 검색 등)를 포함하지 않아 잠재적 사기 패턴을 완전히 포착하지 못한다. 향후 연구에서는 멀티모달 로그 통합, 경량화된 LLM(예: DistilGPT) 적용, 그리고 연합 학습(Federated Learning) 기반 프라이버시 보호를 고려한 확장이 필요하다.

초록

상세 요약

📜 논문 원문 (영문)