시리얼 순위: 서리어를 이용한 강인한 순위 추정

본 논문은 쌍대 비교 데이터를 이용해 아이템을 순위 매기는 새로운 스펙트럴 서리어 알고리즘을 제안한다. 비교 행렬로부터 유사도 행렬을 구성하고, 라플라시안의 두 번째 고유벡터(Fiedler vector)를 정렬해 순위를 복원한다. 완전하고 일관된 비교가 주어질 때 정확히 원래 순서를 회복함을 증명하고, 일부 비교가 손상·누락된 경우에도 일정 조건 하에 완전 복원이 가능함을 보인다. 또한 무작위로 관측된 비교가 적은 희소 그래프 상황에서 Ω(n …

저자: Fajwel Fogel, Alex, re dAspremont

시리얼 순위: 서리어를 이용한 강인한 순위 추정
본 논문은 “Seriation”이라는 고전적인 순서 복원 문제를 순위 추정 문제에 적용함으로써, 쌍대 비교 데이터를 이용한 강인하고 효율적인 순위 알고리즘을 제시한다. 서리어는 아이템 간 유사도가 거리와 반비례하는 일차원 체인 구조를 가정하고, 주어진 무작위 유사도 행렬을 적절히 재배열해 원래 체인을 복원하는 문제이다. 저자들은 먼저 순위가 알려진 경우(아이템이 1,2,…,n 순서대로 정렬된 경우) 쌍대 비교 행렬 C를 이용해 두 종류의 유사도 행렬을 만든다. 첫 번째는 이진 비교를 기반으로 한 S_match 행렬이다. C_{ij}=1이면 i가 j보다 높게 평가된 것이고, -1이면 반대이며, 0은 비교가 없거나 무승부를 의미한다. 이때 S_match_{ij}=½·(n·1·1ᵀ + C Cᵀ)_{ij} 로 정의한다. 모든 비교가 존재하고 순서와 일치하면 S_match_{ij}=n−|i−j| 가 되며, 이는 Robinson(R) 행렬, 즉 strict‑R‑matrix의 정의를 만족한다. 즉, 대각선에서 멀어질수록 값이 감소하는 구조다. 두 번째는 일반화 선형 모델(GLM) 하에서 정의된 S_glm 행렬이다. 각 비교가 독립적으로 발생하고, 아이템 i가 j보다 우위일 확률을 P_{ij}=H(ν_i−ν_j) 로 모델링한다. 여기서 H는 단조 증가하고 H(−x)=1−H(x) 를 만족하는 함수이며, Bradley‑Terry‑Luce 모델이 대표적인 사례다. 관측된 승률 Q_{ij}를 이용해 S_glm_{ij}=∑_{k}

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기