인공 면역 시스템 기반 영화 추천, 친화도 측정법 비교
본 논문은 인공 면역 시스템(AIS)과 협업 필터링(CF)을 결합한 영화 추천기에 두 가지 친화도 측정법, 가중 카파(Weighted Kappa)와 켄달 타우(Kendall’s Tau)를 적용해 성능을 비교한다. 실험 결과 가중 카파가 데이터 손실이 적고 예측 정확도가 약간 더 높아 영화 추천에 더 적합함을 확인하였다.
저자: Uwe Aickelin, Qi Chen
본 논문은 인공 면역 시스템(AIS)과 협업 필터링(CF)을 결합한 영화 추천 모델에 초점을 맞추어, 사용자 간 유사성을 측정하는 ‘친화도(affinity)’ 알고리즘을 두 가지로 교체해 성능을 비교한다. 기존 연구(Cayzer와 Aickelin, 2002‑2005)는 AIS가 영화 추천에 효과적임을 입증했으며, 파라미터(예: 이웃 크기, 겹침 정도)가 결과에 영향을 미친다고 보고했다. 그러나 친화도 측정 방법 자체에 대한 체계적인 검증은 부족했다. 따라서 저자들은 Weighted Kappa(WK)와 Kendall’s Tau(KT) 두 가지 통계적 친화도 측정법을 도입하고, 각각이 AIS 기반 추천에 미치는 영향을 실험적으로 분석한다.
AIS는 면역 네트워크 모델을 차용한다. 사용자는 ‘항체’, 목표 사용자는 ‘항원’으로 모델링되며, 항체 간 상호작용과 항원-항체 결합을 통해 각 항체의 농도(concentration)를 업데이트한다. 농도 변화는 식(1)에서 정의된 자극(k₁), 억제(k₂), 사멸(k₃) 세 파라미터에 의해 조절된다. 논문에서는 k₁=0.3, k₂=0.2, k₃=0.1을 고정하고, 초기 항체 수를 100개로 설정하였다. 농도는 항원과의 친화도는 높이고, 다른 항체와의 친화도가 높을 경우 억제 효과를 받아 감소한다. 이렇게 형성된 최종 항체 집합이 ‘이웃’ 역할을 하며, CF 단계에서 가중 평균(식 6)을 통해 영화 평점을 예측한다.
친화도 측정법은 두 가지로 구현된다. 첫 번째인 Weighted Kappa는 6단계 평점(0,0.2,…,1)을 카테고리화하고, 두 사용자의 공통 영화에 대해 교차 빈도표 fᵢⱼ를 만든다. 가중치 wᵢⱼ는 카테고리 차이에 비례해 1−|i−j|/6 로 정의되며, 동일 카테고리일 때 1, 차이가 클수록 감소한다. 관측 동의도 Pₒ(w)는 Σ fᵢⱼ·wᵢⱼ / n 로 계산하고, 기대 동의도는 무작위 선택을 가정해 0으로 두어 WK = Pₒ(w) 로 단순화한다. 예시에서는 두 사용자의 WK가 0.725로, ‘양호한 동의’를 나타냈다.
두 번째인 Kendall’s Tau는 순서쌍 기반의 비모수 상관계수이다. 각 사용자 쌍의 평점 차이를 비교해 순서가 일치하면 concordant, 반대이면 discordant로 분류한다. 전체 순서쌍 수는 n(n−1)/2이며, KT = (C−D) /
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기