스펙트럼 정렬 기반 그래프 대조 학습
초록
SpecMatch‑CL은 그래프 대조 학습에서 두 뷰가 만든 그래프‑오브‑그래프의 정규화 라플라시안 차이를 최소화하는 새로운 정규화 항을 도입한다. 이 스펙트럼 손실은 완벽 정렬(Perfect Alignment) 대비 손실 차이와 Uniformity 손실 모두에 대한 상한을 제공함을 이론적으로 증명하고, 8개의 TU 벤치마크와 PPI‑306K, ZINC 2M 전이 작업에서 최첨단 성능을 달성한다.
상세 분석
SpecMatch‑CL은 기존 InfoNCE 기반 대조 학습이 인스턴스 수준의 정렬만을 강제하고, 뷰 별로 형성되는 그래프‑오브‑그래프의 전역 구조는 자유롭게 변한다는 한계를 지적한다. 이를 보완하기 위해 각 뷰에서 얻은 그래프 임베딩을 이용해 유사도 행렬 S(v)를 구성하고, 일정 임계값 θ(또는 백분위 기반 적응 임계값)으로 이진 인접 행렬 A(v)를 만든다. 정규화 라플라시안 L(v)=I−D(v)^{−1/2}A(v)D(v)^{−1/2}를 계산한 뒤, 두 뷰의 라플라시안 차이 ‖L(1)−L(2)‖_F²를 스펙트럼 정규화 항 L_G로 정의한다.
이 설계는 두 가지 중요한 이론적 속성을 제공한다. 첫째, Assumption 4.1에 따라 임베딩 차이 ‖z^{(1)}_i−z^{(2)}_i‖₂가 라플라시안 기반 확산 거리 ‖P(1)−P(2)‖_F와 상수 c로 연결될 때, Theorem 4.2는 |L_C−L_C^*| ≤ (t_d)² c τ L_G 형태의 상한을 제시한다. 즉, 스펙트럼 손실이 작아질수록 실제 대조 손실이 이상적인 Perfect Alignment 손실에 근접한다는 의미다. 둘째, Theorem 4.3은 라플라시안의 최소 비영특잇값 λ₂와 평균 임베딩 μ를 이용해 Uniformity 손실 L_unif에 대한 상한을 도출한다. L_G가 감소하면 L_unif ≤ 1−e^{−4t²}·√(2/3)·E
댓글 및 학술 토론
Loading comments...
의견 남기기