노이즈 강인성을 위한 수정된 SPLICE와 비스테레오 확장
본 논문은 기존 SPLICE 알고리즘의 학습 과정을 특징 상관관계를 이용해 수정하고, 스테레오 쌍이 없는 데이터에서도 적용 가능한 비스테레오 버전을 제안한다. 또한, 런타임에 MLLR 기반의 효율적인 노이즈 적응을 도입해 인식 정확도를 크게 향상시켰다. Aurora‑2와 Aurora‑4 실험에서 수정된 SPLICE는 기존 SPLICE 대비 평균 2.93%~10.37% 절대 향상을 보였으며, 런타임 적응까지 결합하면 추가 4.96%~9.89% 개…
저자: D. S. Pavan Kumar, N. Vishnu Prasad, Vikas Joshi
본 논문은 잡음에 강인한 음성 인식 시스템을 구축하기 위해, 널리 사용되는 SPLICE(스테레오 기반 조각별 선형 보정) 알고리즘을 두 차원에서 개선한다. 첫 번째는 기존 SPLICE가 학습 단계에서 청음 \(x\)와 잡음 \(y\) 사이의 완전 상관관계(ρ = 1)를 가정하면서도 실제로는 교차 공분산 \(\Sigma_{xy,m}\) 을 이용해 변환 행렬 \(A_m\)를 추정한다는 모순을 지적한다. 이를 해결하기 위해 저자는 교차 공분산을 배제하고, 각 GMM 클래스의 청음·잡음 평균과 공분산만을 사용해 화이트닝 변환 \(C_m = \Sigma_{x,m}^{1/2}\Sigma_{y,m}^{-1/2}\) 을 정의한다. 변환식은
\
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기