딥 그리핀림 반복 위상 복원 혁신

본 논문은 기존 Griffin‑Lim 알고리즘에 딥 뉴럴 네트워크를 결합한 DeGLI(Deep Griffin‑Lim Iteration) 구조를 제안하여, 단일 진폭 스펙트로그램만으로도 높은 품질의 위상 복원을 가능하게 하고, 블록 수를 조절함으로써 성능과 연산량을 자유롭게 트레이드‑오프할 수 있음을 보였다.

저자: Yoshiki Masuyama, Kohei Yatabe, Yuma Koizumi

본 연구는 진폭 스펙트로그램만으로부터 원본 신호의 위상을 복원하는 문제에 대해, 전통적인 Griffin‑Lim 알고리즘(GLA)의 구조적 한계를 딥 뉴럴 네트워크와 결합함으로써 극복하고자 한다. GLA는 STFT의 중복성을 이용해 진폭이 고정된 스펙트로그램을 일관성 있는 복소 스펙트로그램으로 변환하는 두 단계, 즉 진폭 교체(P_A)와 일관성 투영(P_C)을 반복 적용한다. 그러나 GLA는 신호에 대한 사전 지식이 전혀 없기 때문에 수많은 반복이 필요하고, 최종 재구성 품질이 낮은 것이 일반적이다. 최근에는 DNN을 이용해 위상을 직접 예측하거나 복소 스펙트로그램을 생성하는 시도가 있었지만, 이러한 방법은 네트워크 깊이가 고정돼 있어 추론 시 연산량과 성능을 자유롭게 조절하기 어렵다는 단점을 가진다. 이에 저자들은 GLA의 두 고정 연산을 서브‑블록의 앞뒤에 배치하고, 그 사이에 학습 가능한 DNN을 삽입한 새로운 구조인 Deep Griffin‑Lim Iteration(DeGLI)를 제안한다. 하나의 DeGLI‑블록은 다음과 같은 흐름을 가진다: 입력 X

딥 그리핀림 반복 위상 복원 혁신

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기