알파‑안정분포 혼합을 활용한 블라인드 소스 분리 기법
본 논문은 복소수 대칭 알파‑안정분포를 기반으로 한 혼합 모델을 제안하고, 특성함수 매칭과 압축학습‑OMP 기반의 CL‑OMPR 알고리즘을 이용해 파라미터를 추정한다. 이를 통해 다채널 콘볼루션 오디오 믹스에서 각 주파수 대역별 이진 마스크를 블라인드하게 추정하며, 기존 가우시안 기반 방법보다 향상된 SDR·SIR 성능을 보인다.
저자: Nicolas Keriven (DMA), Antoine Deleforge (PANAMA), Antoine Liutkus (ZENITH)
본 논문은 오디오 신호의 시간‑주파수 도메인에서 기존 가우시안 모델이 갖는 한계를 극복하고자, 복소수 대칭 알파‑안정분포(α‑stable)를 기반으로 한 새로운 블라인드 소스 분리(BSS) 알고리즘을 제안한다. 알파‑안정분포는 특성지수 α에 따라 꼬리가 무거워지며, α=2일 때는 가우시안에 해당한다. 이러한 특성은 음악이나 음성 등 실제 오디오 신호가 갖는 급격한 피크와 넓은 동적 범위를 효과적으로 모델링할 수 있게 한다.
1. **모델 정의**
- 관측 신호 x(f,t)∈ℂ^M은 M개의 마이크 채널에서 얻어진 복소수 STFT 스펙트럼이다.
- 각 소스 s_k(f,t)∈ℂ는 동일한 α‑stable 분포 S_c(·;α_k,f)에서 독립적으로 샘플링되며, 스케일은 1로 고정한다.
- 각 TF 셀에서 가장 큰 절댓값을 갖는 소스만이 실제 관측에 기여한다는 가정을 두어, 비우세 소스는 평균 0, 분산 σ_k,f^2를 갖는 가우시안 잔차 e_k(f,t)로 근사한다.
- 스테어링 벡터 a_k(f)∈ℂ^M은 각 소스가 각 채널에 미치는 공간적 영향을 나타낸다.
- 지배 소스 인덱스 z(f,t)∈{1,…,K}는 다항분포 π_k,f 로 모델링된다.
2. **특성함수 기반 혼합 모델**
- α‑stable 분포는 pdf가 닫힌 형태가 없지만, 특성함수 φ(ω)=E
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기