하이퍼복소수 공간을 활용한 속성 그래프 클러스터링 혁신
초록
본 논문은 그래프 컨볼루션 네트워크에서 발생하는 과도한 스무딩(Over‑Smoothing)과 속성 지배(Over‑Dominating) 문제를 동시에 완화하기 위해, 임의 차원의 노드 속성을 사원수(Quaternion) 형태의 하이퍼복소수 공간으로 변환하고, 사원수 그래프 인코더(QGE)를 이용해 효율적인 특성 결합을 수행한다. 또한 사전 정의된 클러스터 수 k 없이도 학습 가능한 일반화된 클러스터링 손실을 도입해 다양한 k에 대해 재사용 가능한 임베딩을 제공한다. 실험 결과, 제안 모델 HyReaL은 기존 최첨단 방법보다 높은 클러스터링 정확도와 안정성을 보였다.
상세 분석
HyReaL은 속성 그래프 클러스터링에서 두 가지 핵심 장애인 Over‑Smoothing(OS)과 Over‑Dominating(OD)을 동시에 해결한다는 점에서 의미가 크다. 기존 GCN 기반 방법은 그래프 토폴로지를 강조하면서 깊은 레이어를 쌓을 경우 노드 임베딩이 서로 동일해지는 OS 현상이 발생한다. 반면, 클러스터링 목적에서는 노드 간 유사성을 속성에 기반해 정의해야 하는데, 토폴로지 중심의 학습은 속성 정보를 충분히 활용하지 못해 OD 현상을 초래한다. HyReaL은 이러한 모순을 해소하기 위해 임의 차원의 속성을 사원수 형태의 4‑축 하이퍼복소수 공간으로 투사한다(Four‑View Projection, FVP). 사원수는 실수부와 세 개의 허수부로 구성되며, Hamilton 곱을 통해 4배 높은 자유도(DoF)를 제공한다. 이는 적은 파라미터로도 복잡한 특성 결합을 가능하게 하여, 속성 간 상호작용을 강화하고 OD 효과를 감소시킨다. 또한, 높은 DoF 덕분에 깊은 레이어 없이도 충분한 표현력을 확보하므로, 레이어 수를 제한해 OS 현상을 자연스럽게 억제한다. QGE 단계에서는 사원수 가중치 W_Q를 학습하고, 인접 행렬 ˜A와의 곱셈 후 Hamilton 곱을 적용해 토폴로지 정보를 사원수 임베딩에 통합한다. 이때 각 레이어는 φ(·) 비선형 활성화를 거쳐 다중 홉 정보를 축적한다. 최종 임베딩 Γ는 사원수 실수부와 허수부를 평균(⊛)해 실수 벡터로 변환하고, 그래프 재구성 손실 L_kl(=KL)과 클러스터링 손실 L_sc을 결합한 복합 목표함수로 학습된다. 특히 L_sc은 k를 사전에 지정하지 않고도 클러스터링 친화적 임베딩을 유도하도록 설계돼, 다양한 k에 대해 동일 모델을 재사용할 수 있다. 실험에서는 7개 이상의 벤치마크 그래프(예: Cora, Citeseer, Pubmed 등)에서 통계적 유의성 검정, Ablation Study, 시각화 등을 통해 HyReaL이 기존 GAE, VGAE, DAEGC, ARGA 등보다 평균 4~6% 높은 NMI/ARI를 달성함을 입증한다. 전반적으로 HyReaL은 사원수 기반 고차원 변환을 통해 속성-구조 균형을 맞추고, 레이어 깊이에 대한 의존성을 낮춤으로써 속성 그래프 클러스터링 분야에 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기