정확한 서브그래프 동형성 네트워크와 혼합 L0 2 규제로 예측 그래프 마이닝
초록
본 논문은 그래프 레벨 예측에서 서브그래프의 존재 여부를 정확히 판단하는 특성을 활용한 Exact Subgraph Isomorphism Network (EIN)를 제안한다. 혼합 L0,2 규제로 그룹 스파시티를 강제하고, gSpan 기반 서브그래프 열거와 Iterative Hard Thresholding을 결합한 프루닝 전략을 통해 후보 서브그래프 수를 크게 줄이면서도 높은 예측 성능과 해석 가능성을 동시에 달성한다. 실험 결과는 기존 GNN 모델과 비교해 경쟁력 있는 정확도를 보이며, 선택된 서브그래프를 통한 사후 분석도 가능함을 보여준다.
상세 분석
EIN은 그래프 레벨 분류 문제를 대상으로, 입력 그래프 G가 특정 서브그래프 H를 포함하는지를 0·1 지표 ψ_H(G) 로 표현한다. 이 이진 특성은 정확한 서브그래프 동형성 검사에 기반하므로, 기존 GNN이 학습하는 근사적인 메시지 전달보다 구조적 차이를 더 명확히 구분한다. 모델은 두 단계로 구성된다. 첫 번째인 Graph Mining Layer(GML)는 모든 후보 서브그래프 H∈𝓗에 대해 가중치 벡터 β_H∈ℝ^K 를 학습하고, sigmoid 활성화를 통해 K 차원의 임베딩 h를 만든다. 두 번째인 Feed Forward Network(FFN)는 h를 입력으로 받아 최종 라벨을 예측한다. 핵심은 B∈ℝ^{K×|𝓗} 행렬에 혼합 L0,2 규제 ‖B‖_{0,2}≤s 를 부여해, 동시에 s개의 서브그래프만 비활성화되지 않도록 강제하는 것이다. 이는 그룹 스파시티와 동일하게 작동해, 각 서브그래프가 하나의 그룹으로 취급된다.
하지만 |𝓗|는 학습 데이터 전체에서 추출 가능한 모든 연결 서브그래프의 수이므로 지수적으로 커진다. 이를 해결하기 위해 저자는 gSpan 알고리즘을 이용해 서브그래프 탐색 트리를 구성하고, Iterative Hard Thresholding(IHT)과 결합한 프루닝 규칙을 도입한다. 구체적으로, 각 반복 단계에서 B의 업데이트는 B←B−γ∇_Bℓ 후 상위 s개의 열만 남기는 Hard Thresholding(H_s) 연산으로 수행된다. 여기서 ∇Bℓ의 각 열에 대한 L2 노름을 직접 계산하는 대신, Theorem 2.1에서 제시한 상한 UB(H) 를 이용한다. UB(H)는 해당 서브그래프가 포함된 상위 서브그래프들의 그래디언트 기여를 최대화한 값으로, ψ_H(G_i) 의 단조성(서브그래프 포함 관계)과 손실에 대한 편미분 δ{tik} 를 이용해 효율적으로 계산된다.
프루닝 규칙은 다음과 같다. 현재 단계에서 s번째로 큰 ‖β_H‖_2/γ 값보다 작은 UB(H)를 가진 모든 서브그래프 H′(H′⊇H)는 앞으로도 상위 s에 오를 가능성이 없으므로, 해당 서브트리를 탐색하지 않는다. 이를 통해 전체 서브그래프 열거를 피하면서도 최적화 과정에 필요한 정보는 모두 유지한다. 또한, step size γ를 백트래킹으로 결정할 때는 η_H라는 하한값을 사용해 ζ 임계값을 동적으로 설정한다. 결과적으로 알고리즘 1·2는 gSpan 트리를 깊이 우선 탐색하면서 실시간으로 프루닝을 적용하고, 선택된 s개의 서브그래프만을 B에 남긴다.
수렴 이론 측면에서는, 블록 코디네이트 디센트와 IHT의 결합이 비볼록 문제에 대해 서브리니어 수렴률(sublinear convergence)과 임계점에 대한 수렴을 보장한다는 점을 제시한다. 실험에서는 합성 데이터와 화학·생물·재료 분야의 벤치마크 그래프를 사용했으며, EIN은 GCN, GraphSAGE, GIN 등 최신 GNN 모델과 비교해 동일하거나 더 높은 정확도를 기록했다. 특히, s≤100인 경우에도 모델이 선택한 서브그래프는 도메인 전문가가 해석 가능한 화학 구조(예: 특정 작용기)와 일치했으며, 사후 분석을 통해 예측 근거를 시각화할 수 있었다.
요약하면, EIN은 정확한 서브그래프 존재 여부를 특성화함으로써 구조적 차별성을 강화하고, 혼합 L0,2 규제로 모델 복잡도를 엄격히 제한한다. gSpan 기반 프루닝과 IHT의 효율적 결합은 지수적인 후보 공간을 실용적인 수준으로 축소시켜, 높은 예측 성능과 동시에 해석 가능성을 제공한다는 점에서 기존 GNN 기반 접근법과 차별화된다.
댓글 및 학술 토론
Loading comments...
의견 남기기