제한 없는 단순체 디노이징으로 그래프 생성 혁신

본 논문은 확률 단순체 위에서 동작하는 비마코프(no‑Markov) 노이징 방식을 제안한다. 클린 데이터에 대해 서로 독립적인 여러 시점의 노이즈 샘플을 생성함으로써 기존 이산 디퓨전이 갖는 급격한 상태 전이와 누적 오류 문제를 해소한다. Dirichlet 기반 확률 경로와 Voronoi 확률 분석을 통해 이론적 수렴을 보장하고, 그래프 생성 실험에서 기존 이산 디퓨전·플로우 매칭보다 우수한 성능을 입증한다.

저자: Yoann Boget, Alex, ros Kalousis

제한 없는 단순체 디노이징으로 그래프 생성 혁신
본 연구는 이산 데이터, 특히 그래프와 같은 복합 구조를 생성하기 위한 새로운 프레임워크인 “제한 없는 단순체 디노이징”(UNSIDE)을 제안한다. 기존 디퓨전 및 플로우 매칭 모델은 이산 상태 공간에서 직접 전이함수를 학습하거나, 연속 공간에 임의의 노이즈를 추가한 뒤 투영하는 방식을 사용한다. 이러한 접근법은 두 가지 주요 문제를 야기한다. 첫째, 이산 전이 과정에서 그래프의 엣지가 갑작스럽게 삭제되거나 추가되어 구조적 일관성이 깨진다. 둘째, 연속 시간 한계에서 역동역을 강제하는 마코프성 가정은 디노이징 단계마다 오류가 누적되는 현상을 초래한다. UNSIDE는 이러한 한계를 극복하기 위해 확률 단순체 \(S_K\) 위에서 동작하는 비마코프(no‑Markov) 노이징 스킴을 도입한다. 구체적으로, 클린 데이터 \(x_1\) 에 대해 각 시간 \(t\) 의 노이즈 샘플 \(x_t\) 는 서로 조건부 독립적이며, 이는 “조건부 독립성 가정”이라고 부른다. 이 가정 하에 노이징 과정은 이전 상태에 의존하지 않으므로, 역방향 디노이징 시 오류가 누적되지 않는다. 노이징 경로는 Dirichlet 분포 \(\text{Dir}(1+\alpha_t x_1)\) 로 정의된다. 여기서 \(\alpha_t\) 는 \(t\) 에 따라 비감소하는 스케줄이며, \(\alpha_0=0\), \(\alpha_1\to\infty\) 을 만족한다. 이 설계는 모든 \(t\) 에서 노이즈 분포가 전체 단순체에 걸쳐 완전한 지원을 갖게 하여, 기존 인터폴런트 방식이 초래하는 지원 붕괴와 Voronoi 영역에 고정되는 현상을 방지한다. 저자들은 Voronoi 확률 \(P_{V_k}\) 이라는 새로운 이론적 도구를 도입한다. Voronoi 영역 \(V_k\) 는 단순체 내에서 정점 \(e_k\) 에 가장 가까운 점들의 집합이며, \(P_{V_k}\) 는 노이즈 샘플이 원래 정점 \(e_k\) 의 Voronoi 영역에 남아 있을 확률을 의미한다. Dirichlet 경로에 대해 이 확률을 closed‑form으로 구하고, 이를 이용해 노이즈 스케줄 \(a\) (예: \(\alpha_t=-a\log(1-t)\)) 를 직관적으로 조정한다. 실험에서는 다양한 \(a\) 값에 대해 Voronoi 확률이 어떻게 변하는지를 분석하고, 최적의 스케줄을 선택한다. 역방향 과정에서는 다차원 단순체 \(S_{L}^{K}\) 위에서 각 차원 \(x^{(i)}\) 에 독립적인 노이즈를 가정하지만, 전체 벡터 \(x_{1:L}\) 에 대한 조건부 로그확률을 신경망이 출력하도록 설계한다. 이는 기존 이산 디퓨전이 차원별 마코프성을 유지하는 것과 달리, 전체 구조적 의존성을 학습할 수 있게 한다. 학습 목표는 \(p_{\theta}(x_{t-Δt}|x_t)\) 를 실제 디노이징 분포 \(p_{1|t}(x_1|x_t)\) 에 맞추는 것이며, KL 발산 최소화를 통해 최적화한다. 이론적 측면에서 저자들은 제안된 비마코프 프로세스가 진정한 디노이징 분포에 수렴함을 증명한다(섹션 4). 특히, Dirichlet 경로와 Voronoi 확률을 이용해 수렴 속도와 안정성을 분석한다. 실험에서는 합성 그래프와 여러 실세계 벤치마크(예: MUTAG, ENZYMES, ZINC)를 사용해 UNSIDE와 기존 이산 디퓨전·플로우 매칭 모델을 비교한다. 평가 지표는 그래프 구조 일관성, 샘플 다양성, 그리고 FID·MMD와 같은 통계적 거리이다. 결과는 UNSIDE가 모든 데이터셋에서 기존 최첨단 모델을 능가함을 보여준다. 특히, 그래프 연결성을 유지하면서도 높은 다양성을 확보하는 점이 두드러진다. 결론적으로, 이 논문은 확률 단순체 위에서 비마코프 노이징을 구현함으로써 이산 생성 모델의 핵심 제약을 해제하고, 이론적 보장과 실험적 우수성을 동시에 달성한 점에서 큰 의미를 가진다. 앞으로 단순체 기반 디노이징은 텍스트, 이미지와 같은 다른 이산 도메인에도 확장 가능성이 크며, 비마코프 프레임워크와 Voronoi 기반 분석이 새로운 연구 방향을 제시한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기