시간 시계열 생성을 위한 스케일러블 복소 확산
초록
PaCoDi는 푸리에 변환을 대각화 연산자로 활용해 시간 도메인에서의 복잡한 의존성을 주파수 도메인에서 독립적인 스펙트럼 성분으로 전환한다. 복소 잡음의 실·허수 성분을 평균장 이론(MFT)과 인터랙티브 보정 메커니즘으로 복원하면서, 헤르미티안 대칭을 이용해 시퀀스 길이를 절반으로 압축하고, 이질적 손실 함수를 통해 비등방성 잡음을 정밀히 모델링한다. 이론적 증명과 실험을 통해 PaCoDi는 기존 시계열 확산 모델 대비 품질·속도 모두에서 우수함을 보인다.
상세 분석
본 논문은 기존 DDPM 기반 시계열 확산 모델이 갖는 O(L²) 복잡도와 지역적 얽힘 문제를 근본적으로 재구성한다. 핵심 아이디어는 푸리에 변환(F) 을 “대각화 연산자”로 간주해, 시간 도메인의 가우시안 전이 q(xₜ|xₜ₋₁) 가 주파수 도메인에서는 동일한 형태의 복소 가우시안 전이 q(Xₜ|Xₜ₋₁) 로 변환된다는 점이다. 여기서 Xₜ = Rₜ + jIₜ 로 실·허수 성분을 분리하면, 정리 3.1 에 의해 두 성분은 통계적으로 독립이며, 각각 이질적 공분산 Σᵣ, Σᵢ 를 가진다. 이 독립성은 “Quadrature Forward Diffusion”과 “Conditional Reverse Factorization” 정리에서 정식으로 증명되며, 역전파 과정에서도 실·허수 흐름이 서로 조건부로 분리될 수 있음을 보인다.
하지만 실제 데이터 X₀는 복소 스펙트럼 간 위상·상관 관계를 내포하고 있어, 순수한 평균장(MFT) 근사는 이러한 상호 의존성을 소실한다. 이를 보완하기 위해 논문은 “Interactive Correction Mechanism”을 도입한다. 구체적으로, 실부 네트워크 θᵣ 는 허수부 Iₜ 의 투사 h(I) 를 입력으로 받아, 허수부 정보를 간접적으로 활용한다. 허수부 네트워크 θᵢ 도 마찬가지로 실부 투사를 이용한다. 이 설계는 모델 구조는 여전히 병렬화된 두 스트림으로 유지하면서, 학습 단계에서 위상 정보를 복원하도록 만든다.
또한, 헤르미티안 대칭(실신호의 경우 Xₖ = X*{L‑k})을 활용해 스펙트럼 절반만을 처리함으로써 어텐션 연산의 FLOP을 50% 절감한다. 이때 손실 함수는 단순 L2가 아니라, 이질적 공분산을 반영한 Mahalanobis 거리 ‖ε − ε_θ‖²{Σ⁻¹} 를 사용한다. 이는 “Heteroscedastic Loss”라 명명되며, 압축된 복소 매니폴드 상에서 비등방성 잡음 분포를 정확히 모델링한다.
연속시간으로의 확장에서는 “Spectral Wiener Process”를 정의해, 주파수 도메인에서의 브라운 운동을 엄밀히 기술한다. 이를 기반으로 Frequency SDE를 도출하고, 시간 도메인 DDPM과 연속 한계에서 동등함을 증명한다.
실험에서는 전통적인 시계수열 베이스라인(Temporal Diffusion, Transformer‑based Diffusion 등)과 비교해 FID, IS, MSE 등 다양한 지표에서 우수한 성능을 보이며, 특히 2배 이상의 추론 속도 향상을 기록한다. 전체적으로 PaCoDi는 복소 스펙트럼을 이용한 이론적 정당성을 확보하면서도, 평균장 근사와 인터랙티브 보정을 통해 실제 데이터의 복잡한 상관 구조를 유지하는 균형 잡힌 설계라 할 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기