확산 모델 추론 시 정렬을 위한 변분 안정 Doob 매칭

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 사전 학습된 확산 모델을 재학습 없이 목표 분포에 맞추는 추론‑시간 정렬 방법을 제안한다. Doob의 h‑변환을 기반으로 안내(guide) 항을 h‑함수의 로그 기울기로 정의하고, 그래디언트 정규화 회귀를 통해 h‑함수와 그 기울기를 동시에 추정한다. 이 추정기는 비대칭 수렴률을 갖는 일관된 안내 추정기를 제공하며, 2‑Wasserstein 거리에서 목표 분포에 대한 비대칭 수렴 보장을 이론적으로 증명한다. 또한 저차원 구조 가정 하에 차원 저주를 완화하는 적응성을 갖는다.

상세 분석

이 논문은 확산 모델의 추론‑시간 정렬(inference‑time alignment) 문제를 Doob의 h‑transform이라는 확률적 변환 프레임워크에 정형화한다. 기존 연구에서 안내(guide) 항은 목표 분포의 스코어와 사전 모델 스코어의 차이로 표현되었지만, 실제 구현에서는 클래스 분류기, 손실 함수 근사, 혹은 별도 네트워크를 이용한 기울기 추정 등 여러 비정형 방법에 의존해 일관성 및 수렴성이 보장되지 못했다. 저자들은 이 문제를 “변분적으로 안정된(variationally stable) Doob 매칭”이라는 새로운 접근법으로 해결한다. 핵심 아이디어는 목표 분포를 정의하는 가중치 함수 w(x) 에 대해 h(x)=E_{X_T∼p_T}

확산 모델 추론 시 정렬을 위한 변분 안정 Doob 매칭

초록

상세 분석

댓글 및 학술 토론

의견 남기기