온라인 평점 시스템에서 협력 조작 탐지와 분석
초록
본 논문은 온라인 평점 시스템에 나타나는 협력 조작(콜루전) 문제를 다루며, 빈발 아이템셋 마이닝을 이용해 잠재적 콜루전 그룹을 추출한다. 이후 여러 정량적 지표로 그룹의 협력 정도와 피해 규모를 평가하고, 큰 그룹 내에서 아직 식별되지 않은 하위 협력 서브그룹을 탐색하는 알고리즘을 제안한다. 구현 및 실험을 통해 제안 방법의 유효성을 검증한다.
상세 분석
이 연구는 온라인 평점 시스템이 직면한 가장 심각한 위협 중 하나인 협력 조작(콜루전)을 정량적·정성적으로 파악하려는 시도이다. 기존 연구들은 주로 개별 사용자의 비정상적인 평점 패턴을 탐지하는 데 초점을 맞추었지만, 다수 사용자가 조직적으로 동일 제품에 대해 유사한 평점을 남기는 경우, 단순 통계 기반 방법으로는 식별이 어려워진다. 논문은 이러한 문제를 해결하기 위해 두 단계의 프레임워크를 제시한다. 첫 번째 단계는 ‘빈발 아이템셋 마이닝(Frequent Itemset Mining)’을 활용해 동일 제품에 대해 동시에 높은(또는 낮은) 평점을 부여한 사용자 집합을 후보 콜루전 그룹으로 추출한다. 여기서 아이템은 (사용자, 제품, 평점) 삼중항이며, 최소 지지도(minimum support)와 최소 신뢰도(minimum confidence)를 조정함으로써 노이즈를 억제한다. 두 번째 단계에서는 후보 그룹에 대해 여러 지표—예를 들어, 평점 편차 감소율, 시간적 동시성, 제품 다양성, 그룹 내 상호작용 강도 등을 계산한다. 특히 ‘협력 강도(Collusion Strength)’ 지표는 평점 평균과 표준편차, 시간 윈도우 내 평점 발생 빈도를 복합적으로 가중합산해 정의된다. 이러한 지표를 기반으로 그룹을 ‘협력’ 혹은 ‘비협력’으로 분류하고, 피해 정도를 추정하기 위해 ‘피해 지수(Damage Index)’를 도입한다. 피해 지수는 목표 제품의 평균 평점 변동, 판매량(또는 조회수) 변화, 그리고 해당 제품에 대한 후속 평점 흐름을 종합한다.
또한, 논문은 대규모 그룹이 반드시 전체가 협력하는 것은 아니라는 점을 인식하고, ‘서브그룹 탐색 알고리즘(Subgroup Detection Algorithm)’을 설계한다. 이 알고리즘은 후보 그룹을 그래프 형태로 모델링하고, 노드(사용자) 간의 유사도(시간, 평점, 제품) 기반 가중치를 부여한다. 이후 커뮤니티 탐지 기법(예: Louvain 방법)이나 밀도 기반 클러스터링(DBSCAN)을 적용해 고밀도 서브그래프를 추출한다. 이렇게 발견된 서브그룹은 기존 지표를 재평가하여 새로운 콜루전 그룹으로 인정한다.
실험 부분에서는 공개된 전자상거래 평점 데이터셋과 자체 구축한 시뮬레이션 데이터를 활용한다. 시뮬레이션에서는 다양한 규모와 협력 정도의 콜루전 공격을 삽입해 알고리즘의 정밀도·재현율을 측정했으며, 실제 데이터에서는 알려진 사기 사례와 비교해 높은 탐지율을 보였다. 특히, 서브그룹 탐색 단계는 기존 방법이 놓친 미세한 협력 패턴을 20% 이상 추가로 포착함을 입증한다. 전체적으로 이 논문은 콜루전 탐지를 위한 체계적인 파이프라인을 제시하고, 빈발 아이템셋 마이닝과 다중 지표 기반 평가, 그리고 서브그룹 탐색을 결합함으로써 기존 연구보다 높은 탐지 정확도와 실용성을 확보했다는 점에서 의의가 크다.