마이크 배열 처리의 지연‑성능 트레이드오프 분석
본 논문은 실시간 청취 보조 장치에서 요구되는 수밀리초 수준의 지연 제한을 만족하면서, 마이크 배열을 이용한 잡음 감소와 소스 분리를 어떻게 최적화할 수 있는지를 이론적으로 분석한다. 인과적 다채널 Wiener 필터(CMWF)의 평균제곱오차(MSE)를 지연 시간 α에 대한 함수로 정확히 유도하고, 균일 선형 배열과 두 소스·두 마이크 상황 등 두 가지 특수 모델에 대해 폐쇄형 해를 제시한다. 실험에서는 착용형 및 원거리 배열을 사용해 실제 방 …
저자: Ryan M. Corey, Naoki Tsuda, Andrew C. Singer
본 논문은 실시간 청취 보조 장치(예: 보청기, AR 청취 시스템)에서 요구되는 ‘몇 밀리초 이하의 지연’이라는 인간 청각 인지 한계를 이론적으로 분석하고, 마이크 배열을 활용해 지연을 최소화하면서도 잡음 감소와 소스 분리를 최적화하는 방법을 제시한다.
1. **문제 정의와 모델링**
- N개의 음원 s(t)와 M개의 마이크 x(t)를 고려하고, 각 마이크는 선형 시불변 시스템 a_{m,n}(t) 를 통해 음원을 혼합한다.
- 목표 신호 dα(t)는 첫 번째 마이크에서 첫 번째 음원을 α만큼 지연시킨 형태이며, α>0이면 지연, α<0이면 예측을 의미한다.
- 인과적 다채널 Wiener 필터(wα)는 과거 무한대부터 현재까지의 관측 신호만을 이용해 dα(t)를 최소 평균제곱오차(MSE)로 추정한다.
2. **수학적 해석**
- Wiener‑Hopf 방정식 r_{xd}(t−α)=∫₀^∞ wα(u) r_x(t−u) du 를 만족해야 하며, MSE는 E(α)=r_d(0)−∫_{−∞}^{∞} wα(t) r_{xd}(t−α) dt 로 표현된다.
- 비인과적 해(α→∞)는 주파수 영역에서 W_nc(ω)=R_{xd}^H(ω) R_x^{-1}(ω) 로 간단히 구한다.
- 인과적 해를 구하기 위해 Rx(ω)를 스펙트럼 팩터화 Rx(ω)=G(ω)G^H(ω) 로 분해하고, G와 G^{-1}가 인과적임을 이용해 신호를 ‘디코릴레이션’한다.
- 최종 인과적 필터는 W_α(ω)=
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기