개별 사용자 불공정성 해결을 위한 반사실적 접근

개별 사용자 불공정성 해결을 위한 반사실적 접근
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 협업 필터링 기반 추천 시스템에서 특정 사용자에게 발생하는 불공정성을 완화하기 위해 두 단계의 반사실적 프레임워크를 제안한다. 먼저 기존 LightGCN 모델을 이용해 사용자별 NDCG를 측정해 불이익을 받는 사용자를 식별하고, 이후 별도의 예측 모델이 제안하는 상위 아이템을 가상의 상호작용으로 삽입한다. 삽입된 데이터로 재학습한 후 성능 향상 정도(PGain)를 계산해 실제 적용 여부를 결정한다. MovieLens‑100K, Amazon Beauty, MovieLens‑1M 데이터셋 실험을 통해 기존 방법 대비 추천 정확도와 공정성 지표가 모두 개선됨을 입증한다.

상세 분석

이 연구는 협업 필터링(CF) 기반 추천 시스템에서 “개별 사용자 불공정성(Individual User Unfairness, IUU)”이라는 미세한 편향을 정량화하고 완화하는 새로운 방법론을 제시한다. 기존 CF 모델은 전체 사용자 집합에 대해 하나의 손실 함수를 최적화함으로써, 데이터가 희소하거나 활동이 적은 사용자를 상대적으로 소외시킨다. 논문은 이를 해결하기 위해 두 단계의 반사실적(imputation) 절차를 도입한다. 첫 단계에서는 LightGCN(LGCN) 기반 베이스라인 모델 B를 학습하고, 각 사용자의 훈련 데이터에 대한 NDCG 값을 G_prior_u 로 계산한다. NDCG는 일반적으로 정확도 평가에 쓰이지만, 여기서는 “불공정성”의 지표로 활용되어 값이 낮은 사용자를 불이익 사용자 후보(U′)로 선정한다. 또한, |I(u)| 가 작아 데이터가 희소한 경우도 후보에 포함한다.

두 번째 단계에서는 별도의 예측 모델 M(예: MF, NMF 등)을 이용해 후보 사용자에게 아직 관찰되지 않은 아이템 중 예측 점수가 높은 상위 K개를 선택한다. 선택된 아이템 집합 C(u′)는 식 (5)의 파라미터 α와 β에 의해 크기가 조정되며, 이는 전체 평균 상호작용 수와 사용자 희소성에 비례·반비례하도록 설계되었다. 이렇게 선정된 가상의 (u′, i) 엣지를 기존 사용자‑아이템 이분 그래프에 추가함으로써 임시 행렬 R′ 를 만든다. 이후 LightGCN의 메시지 전달 과정을 동일하게 적용해 임베딩을 재계산하고, BPR 손실을 다시 최소화한다.

핵심 성과 지표인 PGain_u′ 은 가상의 상호작용 삽입 전후의 NDCG 차이(G_post_u′ – G_prior_u′)로 정의된다. PGain이 양수이면 해당 사용자의 추천 품질이 향상된 것으로 판단하고, 최종 모델에 해당 삽입을 유지한다. 반대로 음수이면 삽입을 취소한다. 이 과정은 개별 사용자를 대상으로 독립적인 “실험”을 수행하는 형태이며, 전체 사용자 집합에 대한 전역적인 공정성 향상도 동시에 관찰된다.

실험에서는 MovieLens‑100K, Amazon Beauty, MovieLens‑1M 세 데이터셋을 사용해 기존 연구(예: ACFR‑User, 다중 팔 밴딧 기반 방법)와 비교하였다. 결과는 NDCG, HR@10, 그리고 제안된 불공정성 지표에서 모두 유의미한 개선을 보였으며, 특히 데이터가 매우 희소한 사용자에 대해 PGain 평균이 0.15 이상 상승했다.

기술적 강점은 (1) 기존 CF 모델에 최소한의 구조적 변형만 가해 구현이 용이하고, (2) 반사실적 삽입을 통해 “데이터 증강” 효과를 얻어 임베딩 품질을 전반적으로 끌어올린다. 또한, PGain이라는 직관적인 메트릭을 통해 삽입 여부를 자동화함으로써 과도한 인위적 조작을 방지한다.

하지만 몇 가지 한계도 존재한다. 첫째, 가상의 상호작용을 생성하기 위해 별도의 예측 모델 M이 필요하며, M의 품질에 따라 전체 프레임워크 성능이 크게 좌우된다. 둘째, 삽입된 데이터가 실제 사용자 행동을 반영하지 않기 때문에 온라인 서비스에서 실시간 적용 시 사용자 신뢰도에 영향을 미칠 가능성이 있다. 셋째, 불공정성 정의가 NDCG 기반이므로, 다른 공정성 관점(예: 그룹 불공정성, 다양성)에는 직접 적용하기 어렵다. 마지막으로, 대규모 실시간 시스템에 적용하려면 삽입 후보 선정과 재학습 비용을 효율적으로 관리할 추가적인 엔지니어링이 필요하다.

전반적으로 이 논문은 “개별 사용자 수준”의 불공정성을 정량화하고, 반사실적 데이터 증강을 통해 이를 완화하는 실용적인 방법을 제시함으로써 추천 시스템 공정성 연구에 새로운 방향을 제시한다.


댓글 및 학술 토론

Loading comments...

의견 남기기