그래프 도메인 적응을 위한 노이즈 제거 기반 GNN 강화
초록
본 논문은 소스 그래프의 라벨과 타깃 그래프의 구조만을 이용해 노드 분류 성능을 높이는 새로운 프레임워크 GraphDeT를 제안한다. 타깃 그래프에 무작위 노이즈 엣지를 추가하고 이를 정제하는 보조 손실을 학습에 포함시킴으로써 A‑distance를 감소시켜 일반화 경계를 강화한다. 실험 결과, 시간 및 지역 도메인 이동 상황에서 기존 방법들을 크게 앞선 정확도를 달성한다.
상세 분석
GraphDeT는 기존 그래프 도메인 적응 연구가 구조적 차이를 충분히 활용하지 못한다는 점에 착안한다. 소스 그래프는 라벨이 존재하지만 타깃 그래프는 라벨이 없으므로, 두 그래프 사이의 구조적 불일치가 모델 성능 저하의 주요 원인으로 작용한다. 이를 해결하기 위해 저자들은 타깃 그래프에 무작위로 가짜 엣지를 삽입하고, GNN이 이 가짜 엣지를 구분하도록 하는 ‘엣지 디노이징’ 보조 작업을 도입한다. 구체적으로, 타깃 그래프 A_T에 희소 행렬 A’_T를 더해 ˜A_T를 만든 뒤, GNN을 통해 노드 임베딩 ˜h_T를 얻고, Hadamard 곱과 MLP를 이용해 각 노드 쌍 (u,v)의 존재 확률 ˜s_uv를 예측한다. 이때 실제 엣지와 가짜 엣지에 대해 각각 로그 손실을 적용해 ℓ_DeT를 정의한다. 동시에 소스 그래프에 대해서는 전통적인 노드 분류 손실 ℓ_cls를 사용한다. 두 손실을 가중합해 최적화함으로써 모델은 (1) 전체 그래프 구조를 학습하고, (2) 노이즈 엣지를 구분하는 능력을 갖추게 된다.
이론적 기여는 A‑distance와의 연결 고리를 명시한 점이다. 기존 도메인 적응 이론(Ben‑David 등)은 소스와 타깃 분포 사이의 HΔH 거리, 즉 A‑distance가 일반화 상한에 직접 영향을 미친다고 제시한다. GraphDeT는 엣지 디노이징 작업이 임베딩 공간에서 연결된 노드 간 거리를 최소화하도록 제약을 가함으로써, 클래스 판별기 g₁(소스)와 가상의 g₂(타깃) 사이의 불일치 확률 Pr_D_T
댓글 및 학술 토론
Loading comments...
의견 남기기