선형 시간 활성 학습으로 서명 네트워크 링크 분류 최적화

본 논문은 두 클러스터링에 거의 일치하는 서명 네트워크를 가정한 p‑stochastic 모델을 기반으로, O(|V|³⁄²)개의 에지를 질의하면 최적에 상수 배만큼 근접한 실수 오류를 보장하는 선형‑시간 활성 학습 알고리즘을 제시한다. 일반적인 예산 k에 대해서는 O(|V|+(|V|/k)³⁄²)개의 질의로 O(k) 배의 최적성을 달성하며, 전체 복잡도는 O(|E|+|V|log|V|)이다.

저자: Nicolo Cesa-Bianchi, Claudio Gentile, Fabio Vitale

**1. 서론 및 배경** 서명 네트워크는 사회·생물학적 관계를 양·음의 두 가지 부호로 표현한다. 기존 연구는 사회적 균형 이론에 기반해 그래프가 두 클러스터링(친구·적)과 일관된 구조를 가진다고 가정하고, 이를 활용한 스펙트럴 방법이 높은 정확도를 보였지만 O(|V|²) 이상의 시간·메모리 복잡도로 대규모 그래프에 적용하기 어려웠다. 따라서 저자는 활성 학습(active learning) 프레임워크를 채택해, 제한된 수의 에지 라벨만 질의하고 나머지를 예측하는 알고리즘을 설계한다. **2. 문제 정의와 p‑stochastic 모델** - 그래프 G=(V,E)는 무방향이며 각 에지 (i,j)∈E에 라벨 Y_{ij}∈{−1,+1}가 있다. - 두 클러스터링에 완전히 일치하는 기본 라벨링을 만든 뒤, 각 에지를 확률 p<½ 로 뒤집는다. 이를 p‑stochastic 할당이라 부른다. - 이 모델은 라벨 뒤집힘이 독립적일 필요 없이, 전체 에지 집합에서 무작위로 2p|E|개의 에지를 선택해 뒤집는 방식으로 구현될 수 있다. **3. 이론적 하한** Fact 1에 의해, 어떤 활성 학습 알고리즘이 전체 에지의 일정 비율만 질의해도 기대 실수 수는 최소 Ω(p|E|)이다. 따라서 목표는 이 하한에 상수 배 이내로 접근하는 것이다. **4. 기존 저스트레치 트리 기반 방법**

선형 시간 활성 학습으로 서명 네트워크 링크 분류 최적화

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기