구조와 내용 융합을 위한 비음수 행렬분해 기반 네트워크 임베딩
초록
본 논문은 네트워크의 구조와 노드에 부착된 텍스트 콘텐츠를 동시에 고려하는 비음수 행렬분해(NMF) 프레임워크인 FSCNMF를 제안한다. 구조 기반 임베딩과 콘텐츠 기반 임베딩을 각각 학습한 뒤, 서로를 정규화 항으로 활용해 일관성을 강화한다. 또한 고차 근접성을 포착하는 FSCNMF++를 도입하고, 다중 콘텐츠 유형 확장도 제시한다. 실험 결과, 노드 군집화·시각화·다중 클래스 분류 등 다양한 태스크에서 기존 최첨단 방법들을 크게 능가한다.
상세 분석
FSCNMF는 정보 네트워크를 그래프 G = (V,E,F) 로 정의하고, 구조는 인접 행렬 A, 콘텐츠는 TF‑IDF 기반 행렬 C 로 표현한다. 기존 NMF 기반 임베딩은 A≈B₁B₂ 혹은 C≈UV 형태로 각각 구조·콘텐츠를 저차원으로 압축한다. 그러나 실제 네트워크에서는 구조와 콘텐츠 사이에 잡음·불일치가 존재하므로, 두 임베딩을 동일한 행렬에 강제 매핑하면 지역 최적해에 빠지기 쉽다. FSCNMF는 이 문제를 “상호 정규화” 방식으로 해결한다. 구체적으로, 구조 기반 임베딩 B₁ 을 학습할 때 비용 함수에 ‖B₁ − U‖₂² 를 추가해 콘텐츠 임베딩 U와의 거리를 최소화한다(α₁ 파라미터로 가중). 반대로 콘텐츠 임베딩 U 를 학습할 때는 ‖U − B₁‖₂² 를 포함한다(β₁ 파라미터). 이렇게 하면 두 임베딩이 서로를 정규화하면서도 각각의 데이터 특성을 보존한다.
알고리즘은 교번 최적화(Alternating Minimization) 방식으로, 각 단계에서 비음수 제약을 만족하도록 업데이트 규칙을 유도한다. 업데이트는 기존 NMF의 곱셈 규칙에 정규화 항을 가중치‑스케일링 형태로 삽입한 형태이며, 수렴성은 기존 NMF와 동일하게 보장된다.
FSCNMF++는 A의 고차 행렬 Aᵏ (예: A², A³ 등)를 합성해 고차 근접성을 반영한다. 이를 통해 1‑hop 이외의 구조적 유사성도 임베딩에 반영되며, 실제 실험에서 커뮤니티 경계가 뚜렷한 네트워크에서 성능 향상이 관찰된다.
다중 콘텐츠 확장은 각 노드가 텍스트·이미지·비디오 등 여러 모달리티를 가질 때, 각각의 콘텐츠 행렬 C^{(m)} 에 대해 별도 U^{(m)} 를 학습하고, 이를 가중 평균하거나 다중 정규화 항을 추가해 하나의 통합 임베딩 B₁ 을 얻는다.
실험에서는 Cora, Citeseer, Pubmed 등 실제 인용 네트워크와 DBLP, Flickr 등 멀티모달 데이터셋을 사용했다. 평가 지표는 NMI·ARI·ACC(클러스터링), 2‑D t‑SNE 시각화 품질, 그리고 다중 클래스 분류 정확도이다. FSCNMF/FSCNMF++는 기존 DeepWalk, node2vec, LINE, TADW, AANE 등을 모두 앞서며, 특히 콘텐츠와 구조 간 불일치가 큰 데이터셋에서 30 % 이상 성능 향상을 기록한다.
주요 장점은 (1) 구조와 콘텐츠를 별도 임베딩으로 유지하면서 상호 정규화해 잡음에 강인함, (2) 비음수 제약으로 해석 가능한 비음수 좌표 확보, (3) 고차 근접성을 손쉽게 확장 가능한 FSCNMF++ 구조, (4) 다중 모달리티에 대한 일반화 가능성이다. 한계점으로는 (i) 파라미터 α₁,β₁ 등의 튜닝이 필요하고, (ii) 대규모 네트워크에서 행렬 Aᵏ 계산이 메모리·시간 비용을 증가시킬 수 있다는 점이다. 향후 연구에서는 스파스 행렬 곱셈 최적화와 자동 파라미터 학습 메커니즘을 도입해 실시간 대규모 적용을 목표로 할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기