강인하고 일반화 가능한 이질법률 링크 예측
초록
본 논문은 기존 이질 법률 인용 네트워크의 링크 예측 모델에 에지 드롭아웃과 특징 연결을 도입해 표현의 강인성을 높이고, 다국어 노드 특성을 활용한 비대칭 디코더를 설계함으로써 독일과 뉴질랜드의 서로 다른 법체계에 대한 전이 학습 성능을 크게 향상시켰다. 실험 결과, 오류율이 최대 45% 감소하고, AUC‑ROC와 AP 점수에서 현존 최고 수준을 달성하였다.
상세 분석
본 연구는 법률 인용 그래프라는 특수한 이질(heterogeneous) 네트워크에 대한 링크 예측 문제를 다루면서, 두 가지 핵심 기법을 제안한다. 첫 번째는 최근 그래프 신경망(GNN) 분야에서 주목받고 있는 Edge Dropout(DropEdge) 기법을 적용한 것이다. 법률 데이터는 종종 누락된 인용이나 오류가 섞인 메타정보를 포함하므로, 학습 단계에서 무작위로 50%의 에지를 제거함으로써 모델이 특정 에지에 과도하게 의존하는 현상을 방지하고, 일반화 능력을 강화한다. 두 번째는 Feature Concatenation을 통한 다계층 표현의 직접 결합이다. 기존 HGE 모델은 residual connection을 사용했지만, 본 논문은 각 레이어의 출력 벡터를 그대로 이어 붙여 디코더에 전달함으로써, 다양한 홉(hop) 수준의 토폴로지 정보를 한 번에 활용한다. 이는 특히 이질 그래프에서 관계 타입마다 다른 의미적 특성을 보유할 때 유용하다.
디코더 측면에서는 기존 비대칭 내적(decoder) 방식을 interleaved 방식으로 재구성했다. 소스와 타깃 노드의 임베딩을 번갈아 배치함으로써, 다국어 임베딩(예: Jina‑v3)과 같은 고차원 텍스트 특성과의 호환성을 확보하였다. 이 설계는 메타피처가 풍부한 경우에도 차원 불일치 문제를 최소화한다.
실험에서는 독일 법률 데이터셋 OLD201k와 뉴질랜드 법률 데이터셋 LiO338k 두 개를 사용하였다. 두 데이터셋은 구조적으로 유사하지만, 관계 비율(법‑법 vs. 법‑사건)과 텍스트 길이 분포에서 차이를 보인다. 모델은 3‑layer, 각 256 차원의 히든 유닛과 2개의 어텐션 헤드를 갖는 HGT, HGCN, Simple HGN 등 다양한 베이스라인과 비교되었다. 결과는 다음과 같다.
- 성능 향상: R‑HGE는 HGE 대비 AP와 AUC‑ROC에서 평균 2~5%p 상승했으며, 특히 LiO338k에서 오류율이 2.5배 이상 감소했다.
- 에지 드롭아웃 효과: Ablation 실험에서 에지 드롭아웃만 제외했을 때 성능이 가장 크게 저하되었으며, 이는 모델이 스파스한 법률 인용 구조에 얼마나 민감한지를 보여준다.
- 전이 학습: 완전 인덕티브 설정에서 GraphSAGE와 GraphSA‑GE가 가장 안정적인 전이 성능을 보였지만, R‑HGE는 데이터가 충분히 풍부한 OLD201k→LiO338k 전이에서는 여전히 최고 수준을 유지했다. 반대로 LiO338k→OLD201k에서는 데이터 양이 적어 전이 성능이 다소 감소했다.
계산 효율성 측면에서는 R‑HGE가 HGE 대비 약 10% 정도의 추가 연산량을 요구했지만, HGT보다 훨씬 가벼워 실용적인 적용이 가능하다. 또한, 코드와 실험 파이프라인을 공개함으로써 재현성을 확보하였다.
전체적으로 본 논문은 **강인성(robustness)**과 **일반화(generalizability)**를 동시에 달성하기 위한 설계 원칙을 제시하고, 법률 분야와 같이 데이터 품질이 불안정하고 다국어·다문화적 특성이 강한 도메인에 GNN 기반 링크 예측을 적용하는 새로운 길을 열었다.
댓글 및 학술 토론
Loading comments...
의견 남기기