시간 흐름과 잡음 분리를 위한 마르코프 재생산 과정 모델

초록

본 논문은 타임스탬프가 부여된 이벤트들을 관측 노이즈와 구분하고, 서로 다른 마르코프 재생산 과정(MRP)으로부터 발생한 신호 스트림을 자동으로 군집화하는 새로운 추론 방법을 제시한다. 고정된 소스 수나 일정한 관측률을 가정하지 않고, 가변적인 소스 수와 비정상적인 발생률을 동시에 처리한다. 합성 데이터와 새들의 노래 녹음 실험을 통해 제안 기법의 유효성을 검증한다.

상세 분석

이 연구는 기존 다중 객체 추적(multitarget tracking) 기법이 갖는 두 가지 한계를 극복하고자 한다. 첫째, 관측된 이벤트가 어느 소스(또는 객체)에서 발생했는지를 사전에 알 수 없으며, 소스의 개수 자체도 시간에 따라 변한다는 점이다. 둘째, 관측에는 독립적인 클러터(clutter) 노이즈가 섞여 있어, 신호와 잡음을 구분하는 것이 필수적이다. 이를 위해 저자들은 마르코프 재생산 과정(Markov Renewal Process, MRP)을 기반으로 한 확률 모델을 설계한다. MRP는 상태 전이와 이벤트 간 인터벌을 동시에 모델링함으로써, 각 소스가 비정상적인 발생률을 보일 때도 적절히 설명할 수 있다.

모델은 각 소스마다 독립적인 마르코프 체인과 재생산 간격 분포를 가정하고, 전체 관측 집합은 이러한 여러 MRP와 독립적인 포아송 잡음의 혼합으로 표현한다. 추론 단계에서는 관측들을 그래프 형태로 구성하고, 각 관측을 노드, 가능한 전이(시간 순서에 맞는 연결)를 엣지로 두어 최대 가중 매칭(maximum weight matching) 문제로 변환한다. 엣지 가중치는 전이 확률과 인터벌 확률을 로그-우도 형태로 결합한 값이며, 잡음 관측은 소스에 연결되지 않은 노드로 처리한다.

이 최적화는 다항 시간 복잡도를 갖는 Hungarian 알고리즘이나 Blossom 알고리즘을 이용해 효율적으로 풀 수 있다. 결과적으로 얻어지는 매칭은 각 관측이 어느 소스에 속하는지, 혹은 잡음인지를 동시에 결정한다. 실험에서는 합성 데이터에서 소스 수가 5에서 20까지 변동하고, 발생률이 급격히 변하는 상황에서도 높은 정확도(F1 점수 >0.9)를 달성했으며, 실제 새들의 노래 녹음에서는 개별 새의 음성 스트림을 성공적으로 분리해 인간 청취자와 유사한 성능을 보였다.

이 논문의 핵심 기여는 (1) 가변적인 소스 수와 비정상적인 발생률을 동시에 다루는 MRP 기반 모델 제시, (2) 그래프 매칭을 통한 효율적인 추론 알고리즘 설계, (3) 잡음과 신호를 동시에 구분하는 통합 프레임워크 제공이다. 또한, 제안 방법은 영상 기반 다중 객체 추적뿐 아니라, 생물음향 분석, 네트워크 트래픽 모니터링 등 타임스탬프 기반 이벤트 스트림이 존재하는 다양한 분야에 적용 가능하다.