실제 사진을 위한 연속적 저해상도 모델링: 라틴 흐름 매칭 기반 초해상도

실제 사진을 위한 연속적 저해상도 모델링: 라틴 흐름 매칭 기반 초해상도
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 실제 촬영 이미지에 존재하는 복합적인 저해상도(노이즈, 블러, 압축 아티팩트 등)를 연속적인 스케일로 모델링하기 위해 라틴 흐름 매칭(Flow Matching) 기법을 활용한 DegFlow 프레임워크를 제안한다. 단일 고해상도(HR) 이미지만으로 다양한 실세계 LR 이미지를 합성할 수 있어, 대규모 실세계 SR 학습 데이터를 손쉽게 생성하고, 이를 이용한 고정·가변 스케일 SR 모델이 기존 방법보다 현저히 높은 복원 품질을 달성한다.

상세 분석

DegFlow는 두 단계로 구성된 파이프라인을 채택한다. 첫 단계는 Residual Autoencoder(RAE)로, HR 및 LR 이미지를 동일한 인코더에 입력해 압축된 라틴(z) 벡터를 얻고, HR 이미지의 다중 스케일 특징을 스킵 연결을 통해 디코더에 전달함으로써 압축률을 높이면서도 세밀한 디테일을 보존한다. 재구성 손실은 HR과 다양한 스케일의 LR 이미지 모두에 대해 L2 손실을 적용해, 라틴 공간이 저해상도 특성을 충분히 표현하도록 학습한다.

두 번째 단계는 Latent Flow Matching(LFM)이다. 여기서는 조건부 흐름 매칭(Conditional Flow Matching, CFM)을 이용해 HR‑LR 라틴 쌍 사이의 연속적인 변환 경로를 학습한다. 기존 선형 보간이 아닌 자연 큐빅 스플라인을 사용해 시간 t∈


댓글 및 학술 토론

Loading comments...

의견 남기기