GLASS 흐름: 효율적인 보상 정렬을 위한 새로운 전이 샘플링

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

GLASS Flows는 사전 학습된 흐름 매칭 모델을 내부 흐름으로 활용해 ODE 기반으로 마코프 전이 pₜ′|ₜ를 샘플링한다. 이를 통해 SDE‑샘플링의 비효율성을 없애고, 텍스트‑이미지 생성에서 보상 정렬을 고효율·고성능으로 수행한다.

상세 분석

본 논문은 흐름 매칭·확산 모델의 추론 단계에서 보상 정렬을 적용할 때 발생하는 핵심 병목이 “SDE 기반 전이 샘플링”임을 지적한다. SDE는 무작위성을 제공해 탐색·SMC와 같은 알고리즘에 필수적이지만, ODE에 비해 연산량이 크게 늘어나고 이산화 오차도 커진다. 저자들은 이를 해결하기 위해 “내부 흐름 매칭 모델(inner flow matching model)”이라는 개념을 도입한다. 기존 사전 학습된 흐름 매칭 모델 uₜ(xₜ)를 충분통계(sufficient statistic) 변환을 통해 새로운 시간 변수 s∈

GLASS 흐름: 효율적인 보상 정렬을 위한 새로운 전이 샘플링

초록

상세 분석

댓글 및 학술 토론

의견 남기기