도메인 불변 그래프 구조 학습을 위한 적대적 엣지 마스킹
초록
EdgeMask‑DG*는 그래프 도메인 일반화에서 구조적 변동에 강인한 모델을 만들기 위해, 원본 토폴로지와 노드 특성 기반 k‑NN·스펙트럴 엣지를 결합한 풍부한 그래프 위에서 연속적인 마스크를 학습한다. 마스크 생성 네트워크는 희소성 제약 하에 가장 성능을 저하시킬 수 있는 가장 나쁜 마스크를 찾고, GAT 기반 태스크 네트워크는 이러한 적대적 마스크에 견디도록 학습된다. 결과적으로 도메인 불변 서브구조를 자동으로 추출해 Cora‑OOD 등에서 최첨단 성능을 달성한다.
상세 분석
본 논문은 그래프 신경망(GNN)이 도메인 간 토폴로지 차이, 즉 구조적 시프트에 취약하다는 점을 출발점으로 삼는다. 기존의 도메인 일반화 방법은 고정된 그래프 변형이나 전체 그래프에 대한 무작위 교란을 적용하지만, 어느 엣지가 도메인 불변 정보를 담고 있는지 식별하지 못한다는 한계가 있다. 이를 해결하기 위해 저자들은 두 단계의 혁신을 제시한다. 첫 번째는 EdgeMask‑DG라는 최소‑최대 게임 프레임워크이다. 여기서 마스크 네트워크(MaskNet)는 각 엣지에 0~1 사이의 연속값을 할당하고, 희소성 제약(λ·mean(s))을 통해 전체 마스크가 과도하게 밀집되지 않도록 강제한다. 마스크는 현재 고정된 태스크 네트워크(TaskNet, GAT 기반)의 손실을 최대화하도록 학습되며, 반대로 TaskNet은 주어진 마스크 하에서 분류 손실을 최소화한다. 이 과정은 “가장 악조건의 구조 교란에 견디는” 표현을 학습하게 만든다. 두 번째 혁신은 EdgeMask‑DG*로, 원본 그래프에 노드 특성 기반 k‑NN 엣지와 스펙트럴 클러스터링으로 만든 전역 클러스터 엣지를 추가해 풍부한 그래프 G′를 만든다. 이렇게 하면 원본 토폴로지가 희소하거나 도메인‑특정 잡음이 많을 때도, 특성 기반 연결을 통해 잠재적인 도메인 불변 구조를 보완할 수 있다. 마스크는 이제 원본 엣지와 새로 만든 엣지 모두에 적용되며, GAT의 어텐션 메커니즘에 마스크 값을 edge attribute로 직접 결합한다. 이는 어텐션 스코어가 마스크에 의해 자동으로 조정돼, 불필요하거나 위험한 연결은 자연스럽게 낮은 가중치를 받게 함을 의미한다. 논문은 이 프레임워크를 다양한 벤치마크(ACM, DBLP, Citation, ArXiv, Facebook‑100, Twitch, Amazon‑Photo, Elliptic 등)에서 평가했으며, 특히 Cora‑OOD에서 최악 도메인 정확도를 78.0%까지 끌어올려 기존 74.2% 대비 3.8%p 상승시켰다. 실험 설정은 소스 도메인만 사용하고 타깃 도메인에 대한 어떠한 정보도 제공하지 않는 순수 DG 설정을 유지한다. 또한, 마스크의 연속값을 사용함으로써 미분 가능성을 보장하고, 최적화가 안정적으로 수렴하도록 설계했다. 전체적으로 이 연구는 (1) 적대적 마스크를 통한 구조적 강인성 학습, (2) 특성 기반 풍부한 그래프 구성, (3) GAT과의 자연스러운 결합이라는 세 축을 통해 도메인 일반화 문제에 새로운 해결책을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기