두 단계 앙상블 기반 음악 소스 복원 시스템

본 논문은 마스터링된 음악에서 원본 악기 스템을 복원하는 Music Source Restoration(MSR) 과제에 대해, 사전 학습된 분리 모델들의 앙상블로 초기 추정치를 만든 뒤, BSRNN 기반 복원 모델을 이용해 각 악기별로 정밀하게 재구성하는 두 단계 파이프라인을 제안한다. 실험 결과, 제안 시스템은 공식 벤치마크에서 모든 지표에서 기존 베이스라인을 능가했으며, 제출물 중 2위 성적을 기록하였다.

저자: Xinlong Deng, Yu Xia, Jie Jiang

본 논문은 2026년 ICASSP에서 처음 제시된 Music Source Restoration(MSR) 챌린지를 목표로, 완전 마스터링된 음악 트랙에서 원본(비가공) 악기 스템을 복원하는 새로운 과제에 대한 솔루션을 제시한다. 기존의 음악 소스 분리(MSS)와 오디오 복원 연구는 각각 “믹스에서 개별 악기를 추출”하거나 “손상된 오디오를 정화”하는 데 초점을 맞추었지만, MSR은 두 가지 과제를 동시에 해결해야 하는 복합 문제이다. 즉, 이퀄라이징, 다이내믹스 컴프레션, 리버브, 코덱 압축 등 실제 제작 과정에서 가해진 비선형 변형을 역전시켜 원본 스템을 복원해야 한다. 이를 위해 저자들은 두 단계로 구성된 파이프라인을 설계하였다. 첫 번째 단계는 사전 학습된 최신 MSS 모델들의 앙상블이다. 구체적으로, BS‑RoFormer

두 단계 앙상블 기반 음악 소스 복원 시스템

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기