베이지안 하모닉 모델 기반 피치 트래킹: 잡음 강인성 및 시간적 연속성 향상

본 논문은 하모닉 모델에 기반한 베이지안 프레임워크를 제안한다. 기본 주파수(f₀), 조화 차수(K), 그리고 유성/무성 상태(u)를 1차 마코프 과정으로 모델링해 시간적 스무스성을 강제하고, 효율적인 분석형 우도 함수를 도입해 잡음에 강인한 피치 추적기를 구현한다. Keele 데이터베이스와 파킨슨 환자 음성 데이터에서 기존 신경망·비모수 기법 대비 평균 절대 오차와 대오차를 각각 15‑36%·20‑26% 감소시켰으며, MATLAB 구현 코드를…

저자: Liming Shi, Jesper Kjaer Nielsen, Jesper Rindom Jensen

베이지안 하모닉 모델 기반 피치 트래킹: 잡음 강인성 및 시간적 연속성 향상
본 논문은 음성 및 음악 신호에서 가장 기본적인 특성인 기본 주파수(f₀)를 정확히 추정하기 위한 새로운 베이지안 피치 트래킹 알고리즘을 제안한다. 기존의 하모닉 모델 기반 추정기는 높은 잡음 강인성과 옥타브 오류 감소라는 장점을 갖지만, 프레임별 독립 처리로 인해 시간적 스무스성, 조화 차수(K) 변화, 그리고 유성/무성 상태(u)를 고려하지 못한다는 문제점이 있었다. 이를 해결하기 위해 저자들은 베이지안 프레임워크에 1차 마코프 과정 모델을 도입하여 f₀, K, u 각각에 대한 스무스성 프라이어를 정의하고, 상태 전이와 관측 모델을 통합한 전체 확률 모델을 구축하였다. 관측 모델은 yₙ = uₙ Z(ωₙ,Kₙ)a_{Kₙ} + vₙ 로 표현된다. 여기서 Z(ωₙ,Kₙ)는 코사인·사인 함수를 이용한 하모닉 사전행렬이며, a_{Kₙ}는 각 조화의 선형 가중치, ωₙ는 디지털 라디안 주파수, Kₙ는 현재 프레임에서 사용되는 조화 개수, uₙ는 유성(1)·무성(0) 이진 변수이다. 무성 구간에서는 yₙ = vₙ 로 단순 화이트 가우시안 잡음 모델을 사용한다. 상태 벡터 xₙ =

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기