비정상 잡음 기반 스펙트럼 뺄셈과 SNR 의존 위상 보정에 의한 두 단계 음성 향상

본 논문은 저주파 영역을 이용한 비정상 잡음 추정과 SNR에 따라 가변적인 위상 보정을 결합한 두 단계 음성 향상 기법을 제안한다. 첫 단계에서는 스펙트럼 뺄셈을 통해 magnitude를 복원하고, 두 번째 단계에서는 추정된 SNR에 기반해 위상을 보정한다. NOIZEUS 데이터베이스를 이용한 실험에서 기존 MBSS, PSC, SMPO와 비교해 향상된 PESQ 및 STOI 점수를 얻었다.

저자: Md Tauhidul Islam, Asaduzzaman, Celia Shahnaz

본 논문은 비정상 잡음이 존재하는 악조건 환경에서의 음성 향상을 목표로, 두 단계로 구성된 새로운 프레임 기반 처리 파이프라인을 제안한다. 첫 번째 단계는 기존 스펙트럼 뺄셈(Spectral Subtraction) 방식을 확장한 것으로, 잡음 스펙트럼을 저주파 영역(0~50 Hz)에서 직접 추정한다. 저주파 대역은 인간 음성 에너지가 거의 없으므로, 해당 구간의 파워 스펙트럼을 잡음으로 간주하고, 현재 프레임의 Y

비정상 잡음 기반 스펙트럼 뺄셈과 SNR 의존 위상 보정에 의한 두 단계 음성 향상

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기