부분 관측 네트워크의 링크 예측
관측된 네트워크가 실제 네트워크의 부분 샘플이며 양성·음성 에러의 샘플링 비율이 서로 다를 때, 노드 속성과 구조 정보를 결합한 확률 순위 추정 방법을 제안한다. 제안 기법은 관측된 엣지와 비관측 엣지 모두에 대해 상대적인 링크 존재 확률을 계산하고, 시뮬레이션 및 실제 단백질‑단백질 상호작용·학교 친구 관계 데이터에서 기존 방법보다 우수한 성능을 보인다.
저자: Yunpeng Zhao, Elizaveta Levina, Ji Zhu
**1. 연구 배경 및 문제 정의**
링크 예측은 네트워크 과학에서 핵심 과제로, 기존 방법은 크게 두 갈래로 나뉜다. 첫 번째는 노드 간 유사도(공통 이웃, Jaccard 등)를 기반으로 한 비지도 방식이며, 두 번째는 관측된 엣지를 양·음성 라벨로 보고 지도 학습(로지스틱 회귀, SVM 등)으로 접근한다. 그러나 생물학적 네트워크(단백질‑단백질 상호작용, 유전자 조절망)에서는 부재 엣지가 실제 부재를 의미하지 않을 경우가 많아 음성 라벨이 거의 없거나 불확실하다. 이런 상황을 “부분 관측 네트워크”라 정의하고, 기존 지도 학습 방법은 라벨 부족으로 성능이 급격히 저하된다.
**2. 통계적 모델링**
저자들은 실제 네트워크 \(A^{\text{true}}\) 를 베르누이 확률 \(P_{ij}\) 로 모델링하고, 관측 과정에서 양성(실제 존재) 엣지는 확률 \(\alpha\) 로, 음성(실제 부재) 엣지는 확률 \(\beta\) 로 올바르게 기록된다고 가정한다. 이때 관측된 인접 행렬 \(A\) 의 각 원소는
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기