진화형 라우터 특성 생성으로 제로샷 그래프 이상 탐지 향상
초록
본 논문은 이질적인 그래프 도메인에서 라우터가 적절한 전문가(GNN)를 선택하도록 돕는 진화형 특성 생성(EvoFG) 프레임워크를 제안한다. LLM 기반 자동 특성 생성, 샤플리 값 근사에 의한 특성 선택, 메모리 강화 라우터와 불변 학습 목표를 결합해, 기존 단일 GNN 기반 제로샷 그래프 이상 탐지보다 일관되게 높은 성능을 달성한다.
상세 분석
EvoFG는 제로샷 그래프 이상 탐지(GAD)에서 가장 큰 병목인 “라우터 일반화 능력 부족”을 체계적으로 해결한다. 첫 번째 단계는 표준화된 원시 특성(예: 로컬 이웃 유사도, 페이지랭크, 스무스니스 점수 등)을 정의하고, 이를 프롬프트로 LLM에게 전달해 새로운 구조적 특성을 생성한다. 여기서 LLM은 체인‑오브‑생각(chain‑of‑thought) 방식을 사용해, 예를 들어 “노드의 2‑hop 평균 클러스터링 계수”와 같은 복합 특성을 제안한다. 생성된 후보 특성은 모두 동일한 차원으로 정규화된 뒤, 라우터 성능에 대한 기여도를 샤플리 값으로 평가한다. 전체 조합을 열거하는 것은 계산적으로 불가능하므로, 논문은 샘플링 기반 근사와 라우터의 프록시 태스크(전문가 가중치 예측 정확도)로 대체한다. 이 과정은 매 반복마다 특성 집합 ℱ 를 갱신하고, 기여도가 양(또는 일정 임계값 이상)인 특성만을 보존한다.
두 번째 단계는 메모리‑강화 라우터이다. 라우터는 입력 특성 ℱ 을 토대로 라우팅 로짓 G 을 생성하고, 소프트맥스 P = Softmax(G) 를 통해 각 전문가에 대한 가중치를 산출한다. 메모리 모듈은 이전 반복에서 학습된 라우팅 패턴을 키‑값 형태로 저장하고, 새로운 특성이 추가될 때 해당 패턴을 재활용한다. 이는 라우터가 급격히 변하는 특성 공간에 적응하면서도, 기존에 검증된 “도메인 불변” 신호를 유지하도록 돕는다.
세 번째로 도입된 불변 학습(invariant learning) 목표는 환경(특성 서브셋)마다 라우터가 동일한 라우팅 결정을 내리도록 강제한다. 구체적으로, 라우터 입력을 무작위 마스킹해 여러 “환경” e 를 만든 뒤, 각 환경에서의 라우팅 로짓 G⁽ᵉ⁾ 에 대해 위험 최소화(Risk = Eₑ
댓글 및 학술 토론
Loading comments...
의견 남기기