신호 불변량을 이용한 비선형 블라인드 소스 분리
본 논문은 측정 데이터 x(t)의 속도 dx/dt에 대한 고차 국부 상관을 이용해 정의한 스칼라 불변량을 통해 비선형 블라인드 소스 분리(BSS)를 수행한다. 소스 변수 s는 (s, ds/dt) 공간에서 각 성분의 확률밀도함수가 곱 형태가 되도록 가정하고, 이 조건이 만족될 때만 데이터가 분리 가능함을 보인다. 제시된 알고리즘은 고차 상관량을 계산하고, 이를 정규화·대각화하여 스칼라 함수를 얻은 뒤, 이 함수들의 1차원 매니폴드 구조를 확인함으…
저자: David N. Levin (University of Chicago)
본 논문은 비선형 블라인드 소스 분리(BSS) 문제를 새로운 관점에서 접근한다. 기존의 BSS는 측정 데이터 x(t)와 원천 신호 s(t) 사이에 비선형이지만 가역적인 혼합 함수 f 를 가정하고, s 가 상태공간 (s)에서 독립적인 확률밀도 ρ_S(s)=∏_k ρ_k(s_k) 를 만족한다는 조건만으로는 해가 다중으로 존재한다는 비유일성 문제에 직면한다. 저자는 이를 해결하기 위해 (s, ds/dt) 공간에서의 독립성을 가정한다. 즉, ρ_S(s, ṡ)=∏_k ρ_k(s_k, ṡ_k) 이라는 강한 조건을 도입함으로써, 순열·성분별 변환을 제외하고는 해가 유일함을 증명한다.
이론적 배경으로, (s, ṡ) 공간의 확률밀도는 데이터 x와 그 속도 ẋ 의 국부 확률분포와 직접 연결된다. 저자는 이전 연구에서 이 확률밀도가 리만 기하학적 메트릭을 정의하며, 메트릭은 ẋ 의 2차 상관 텐서와 동일함을 보였다. 그러나 메트릭과 그 도함수를 정확히 추정하려면 고차원에서는 방대한 데이터가 필요했다. 따라서 본 논문에서는 메트릭 대신 ẋ 의 고차 국부 상관량 C_{kℓ…}(x)=⟨(ẋ_k−⟨ẋ_k⟩)…(ẋ_ℓ−⟨ẋ_ℓ⟩)⟩ 을 사용한다.
알고리즘은 다음 단계로 구성된다.
1) 데이터 x(t) 로부터 ẋ(t) 를 계산하고, 작은 이웃에서 시간 평균을 통해 C_{kℓ…}(x) (2차, 3차, 4차, 5차 등)를 추정한다.
2) 2차 상관 텐서 C_{kℓ}(x) 를 정규화·대각화하는 행렬 M(x) 를 구한다. M(x) 는 (7)과 (8)의 조건을 만족하도록 구성되며, 이는 C_{kℓ}(x) 를 단위 행렬로, 4차 상관 텐서 C_{kℓmm}(x) 를 대각 행렬로 만든다.
3) 변환된 상관량 I_{kℓ…}(x)=M_{kk'}(x)M_{ℓℓ'}(x)…C_{k'ℓ'…}(x) 를 계산한다. 이 I 함수들은 좌표 변환에 대해 스칼라(불변량)이며, 전역적인 순열·반사만이 차이를 만든다.
4) N=2인 경우, I_{111}(x), I_{1111}(x), I_{11111}(x) 을 하나의 3차원 벡터 I_A(x) 로, I_{222}(x)…을 I_B(x) 로 만든다. 이 두 벡터를 각각 3차원 공간에 플롯한다.
5) 플롯된 점들이 각각 1차원 곡선(매니폴드) 위에 존재하면, 해당 I 함수가 하나의 소스 변수 s₁ 또는 s₂에만 의존한다는 증거가 된다. 곡선을 파라미터화한 좌표 σ_A(x), σ_B(x) 를 정의한다.
6) Takens 임베딩 정리에 의해 x 는 (I_A, I_B) 에 가역적으로 매핑되므로, σ 좌표계 역시 x 와 가역적이다. 따라서 σ_A, σ_B 가 각각 원천 신호 s₁, s₂ 와 일대일 대응한다.
7) 최종적으로 σ 좌표계에서 확률밀도 ρ_σ(σ)=ρ_{σ_A}(σ_A)·ρ_{σ_B}(σ_B) 가 성립하는지 확인한다. 성립하면 데이터는 완전히 분리된 것이다.
이 절차는 비선형 혼합 함수 f 가 어떤 형태이든(미분 가능하면) 적용 가능하며, 선형 혼합 경우에는 σ 좌표가 선형 변환 W·x 에 비선형 함수 g(·) 를 합친 형태가 된다. 저자는 또한 ∂σ_i/∂x_k 가 x‑독립적인 벡터와 비례하는지를 검사함으로써, 복원된 소스가 실제로 측정값과 선형 관계가 있는지 판단하는 방법을 제시한다.
실험에서는 두 개의 음성‑유사 신호를 단일 마이크로 녹음한 데이터를 사용하였다. 기존의 미분기하학적 방법은 수 시간 이상의 관측이 필요했지만, 제안된 고차 상관량 기반 방법은 수 분 내의 데이터만으로도 충분히 정확한 M(x) 와 I 함수를 추정했다. 플롯 결과 I_A, I_B 가 각각 명확한 1차원 곡선을 형성했으며, 파라미터화된 σ 좌표계에서 음성 신호의 스펙트럼 특성이 서로 독립적으로 분리되는 것을 확인했다.
결론적으로, 이 논문은 (s, ṡ) 공간에서의 독립성 가정을 통해 비선형 BSS의 유일성을 보장하고, 고차 국부 상관량을 이용한 실용적인 알고리즘을 제시한다. 데이터 양 요구량이 크게 감소하고, 반복적 최적화가 필요 없으며, 전 과정이 수학적으로 닫힌 형태로 전개된다는 점에서 기존 방법들에 비해 큰 장점을 가진다. 다만, 고차원 일반화와 노이즈에 대한 강건성 확보는 향후 연구 과제로 남는다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기