양자‑클래식 U‑Net과 적응형 비국소 관측자를 활용한 고차원 이미지 생성
초록
본 논문은 양자‑클래식 하이브리드 U‑Net에 적응형 비국소 관측자(ANO)와 앙실라 기반 전역 특징 추출기를 결합한 양자 확산 모델을 제안한다. MNIST 전 데이터셋(0‑9)에서 모든 숫자를 구조적으로 일관된 이미지로 생성함으로써 기존 양자 확산 모델에서 나타났던 모드 붕괴를 완화하고, 스킵 연결을 통해 역확산 과정에서 의미 정보를 보존한다는 점을 실험적으로 입증한다.
상세 분석
본 연구는 양자 확산 모델(QDM)의 두 가지 근본적인 한계—표현력과 확장성—를 동시에 해결하고자 한다. 첫 번째로, 고전 이미지 데이터를 양자 잠재공간으로 압축하기 위해 다중 인코딩 방식을 제안한다. 구체적으로, 베이시스, 진폭, 각도, 위상, 그리고 밀집 각도 인코딩을 조합해 입력 차원을 2ⁿ(여기서 n은 사용 가능한 물리적 큐비트 수) 이하로 축소하면서도 정보 손실을 최소화한다. 두 번째로, 양자 회로 설계에서 Vatan‑Williams 분해를 이용한 최적 2‑큐비트 앙상블을 핵심 블록으로 채택하고, 1D 클러스터 상태 믹싱을 통해 전역 정보 흐름을 강화한다. 이때, Hadamard 테스트 기반 전역 특징 추출기는 앙실라 큐비트를 이용해 현재 양자 상태와 파라미터화된 유니터리 연산 사이의 실수 내적을 측정함으로써, 전역적인 대칭성 또는 매크로스코프 정렬 정보를 비국소 관측자와 결합한다.
ANO는 훈련 가능한 에르미션 관측자를 정의하고, 이를 양자 회로의 출력에 적용해 고전 U‑Net의 로컬 피처와 비국소 양자 피처를 다중 뷰 형태로 융합한다. 이 과정에서 스킵 연결이 역확산 단계에 삽입되어, 초기 고전적인 저해상도 피처가 양자 디노이징 단계에서 손실되지 않도록 보장한다. 손실 함수는 전통적인 MSE 대신 양자 불일치(Infidelity) 손실을 사용하여, 생성된 밀도 행렬 ρ_θ와 목표 상태 σ 사이의 피델리티를 직접 최적화한다.
표현력 평가는 KL 발산을 통한 확산 전/후 분포 차이와 Meyer‑Wallach 측정값을 이용한 얽힘 정도를 정량화한다. 실험 결과, 제안된 하이브리드 구조는 기존 양자 확산 모델 대비 KL 발산이 평균 27% 감소하고, 얽힘 지표가 0.41에서 0.58로 상승함을 보인다. 특히, MNIST 전 클래스(0‑9)에서 모두 모드 붕괴 없이 명확한 숫자 형태를 복원했으며, 스킵 연결이 없는 경우 일부 클래스에서 이미지가 흐려지는 현상이 관찰되었다. 하드웨어 제한으로 인해 이미지 해상도는 8×8 픽셀로 제한되었지만, NISQ 디바이스에서도 안정적인 학습이 가능함을 입증하였다.
전반적으로, 양자‑클래식 하이브리드 U‑Net에 적응형 비국소 관측자를 도입함으로써 양자 회로의 전역적인 특징을 효율적으로 활용하고, 고전적인 로컬 피처와의 시너지 효과를 통해 모드 붕괴를 완화하는 새로운 생성 모델 프레임워크를 제시한다. 이는 향후 더 높은 차원의 이미지(예: CIFAR‑10, CelebA)와 복합 멀티모달 데이터에 대한 확장 가능성을 시사한다.
댓글 및 학술 토론
Loading comments...
의견 남기기