텍스트 풍부 동적 그래프 생성 벤치마크 GDGB
초록
본 논문은 고품질 텍스트 속성을 갖는 8개의 동적 텍스트‑속성 그래프(DyTAG) 데이터셋을 제공하고, 이를 기반으로 전이학습형 동적 그래프 생성(TDGG)과 신규 노드 생성이 포함된 귀납형 동적 그래프 생성(IDGG) 두 가지 생성 과제를 정의한다. 구조·시간·텍스트 품질을 동시에 평가할 수 있는 다중 지표 체계를 설계하고, LLM 기반 다중 에이전트 프레임워크인 GAG‑General을 제안한다. 실험을 통해 텍스트 품질이 구조적 일치도에 미치는 영향을 입증하고, 제안된 벤치마크가 향후 DyTAG 생성 연구의 표준이 될 수 있음을 보인다.
상세 분석
GDGB는 기존 DTGB가 갖는 텍스트의 짧고 의미가 빈약한 문제를 해결하기 위해 노드와 엣지 모두에 풍부한 자연어 설명을 부여한다. 데이터셋은 전자상거래(Sephora), 소셜 네트워크(WeiboTech, WeiboDaily), 위키 기반 상호작용(WikiRevision, WikiLife), 영화 협업(IMDB), 인물 전기(WikiLife) 등 8개 도메인으로 구성되며, 각 도메인마다 평균 텍스트 길이, 퍼플렉시티, LLM 기반 품질 점수에서 DTGB를 크게 앞선다.
두 생성 과제는 그래프의 시간적 진화를 어떻게 모델링하느냐에 차이가 있다. TDGG는 주어진 소스·목적 노드 집합 내에서 시간 순서대로 발생하는 엣지와 텍스트를 재구성하도록 요구한다. 여기서는 모든 노드가 사전에 알려져 있으므로 노드 생성보다는 엣지와 텍스트의 시계열적 일관성을 유지하는 것이 핵심이다. 반면 IDGG는 새로운 노드가 등장하는 상황을 포함한다. 따라서 모델은 노드 삽입, 삭제, 속성 부여, 그리고 엣지 연결까지 전 과정을 학습해야 하며, 이는 실제 서비스에서 신규 사용자·상품이 지속적으로 유입되는 현상을 모사한다.
평가 지표는 구조적 정확도(그래프 스펙트럼 MMD, degree distribution), 텍스트 품질(Perplexity, LLM‑Score), 그리고 임베딩 기반 유사도(그래프 레벨 임베딩 거리) 세 축으로 구성된다. 이러한 다면적 평가는 단일 지표에 의존하는 기존 연구와 달리, 생성된 그래프가 구조·시간·내용 모두에서 현실성을 유지하는지를 종합적으로 판단한다.
GAG‑General은 LLM을 활용한 다중 에이전트 시스템으로, 각 에이전트가 노드 생성, 엣지 연결, 텍스트 작성 등 역할을 분담한다. 프롬프트 설계와 메모리 관리 기법을 통해 시계열 컨텍스트를 유지하면서도 대규모 그래프를 효율적으로 생성한다. 실험 결과, GAG‑General은 VRDAG와 DG‑Gen 같은 최신 생성 모델보다 TDGG와 IDGG 모두에서 낮은 MMD와 높은 텍스트 품질 점수를 기록한다. 특히 텍스트가 풍부한 GDGB에서는 텍스트 정보를 활용했을 때 구조적 일치도가 크게 향상되는 반면, DTGB에서는 텍스트 품질 저하로 오히려 성능이 감소하는 현상이 관찰된다. 이는 고품질 텍스트가 동적 그래프 생성에 필수적임을 실증한다.
전체적으로 GDGB는 데이터 품질, 과제 정의, 평가 체계, 그리고 베이스라인 프레임워크까지 일관된 생태계를 제공함으로써, 동적 텍스트‑속성 그래프 생성 연구의 표준화와 가속화를 가능하게 한다.
댓글 및 학술 토론
Loading comments...
의견 남기기