조화 탐색 기반 블록 매칭 알고리즘으로 효율적인 모션 추정
초록
본 논문은 영상 코딩에서 핵심적인 블록 매칭 모션 추정 문제를 조화 탐색(Harmony Search, HS) 알고리즘과 적합도 근사 모델을 결합하여 해결한다. 검색 창 내의 후보 움직임 벡터를 해밍(음)처럼 탐색하고, 적합도 함수를 통해 매칭 품질을 평가한다. 실험 결과, 전통적인 전면 탐색(FSA) 대비 연산량을 크게 줄이면서도 PSNR 손실을 최소화하는 성능을 보였다.
상세 분석
블록 매칭(BM) 기반 모션 추정은 현재 프레임을 일정 크기의 블록으로 분할하고, 이전 프레임에서 동일 크기의 블록을 찾아 가장 유사한 위치를 찾는 과정이다. 이때 매칭 품질을 판단하는 대표적인 지표는 평균 제곱 오차(MSE) 혹은 절대 차이 합(SAD)이며, 이러한 비용 함수를 최소화하는 움직임 벡터(MV)를 찾는 것이 최적화 문제와 동일한 형태를 가진다. 전면 탐색(FSA)은 모든 후보 위치를 전부 평가하므로 정확도는 최고이지만 연산 복잡도가 O(N²)으로 비현실적이다. 따라서 다단계 탐색, 3‑step, Diamond Search 등 다양한 빠른 BM 알고리즘이 제안되었지만, 탐색 영역을 제한함에 따라 최적 MV를 놓치는 경우가 빈번히 발생한다.
조화 탐색(HS)은 음악가가 즉흥적으로 음을 선택하고 조화를 이루는 과정을 모방한 메타휴리스틱으로, 해석적 파라미터인 HM(해밍 수), HMCR(해밍 고려 비율), PAR(피치 조정 비율) 등을 통해 후보 해(solution)를 반복적으로 개선한다. HS는 탐색 공간이 연속적이든 이산적이든 적용 가능하고, 전역 탐색 능력이 뛰어나 로컬 최소에 빠지는 위험이 상대적으로 낮다. 본 논문은 이러한 HS의 특성을 BM 문제에 적용한다. 구체적으로, 검색 창 내 모든 가능한 MV를 HS의 초기 해밍(음)으로 설정하고, 각 해에 대해 적합도 함수(예: SAD)를 계산한다. 이후 HMCR에 따라 기존 해밍을 복제하거나, 랜덤하게 새로운 MV를 생성하고, PAR에 따라 작은 변동(피치 조정)을 가한다.
핵심적인 혁신은 적합도 근사 모델을 도입한 점이다. 매칭 비용을 직접 계산하는 대신, 최근 몇 차례의 실제 비용값을 이용해 회귀 혹은 가우시안 프로세스와 같은 모델을 학습한다. 이렇게 하면 후보 MV에 대한 비용을 빠르게 예측할 수 있어, 실제 비용 계산을 수행해야 하는 횟수를 크게 줄인다. 근사 모델은 매 iteration마다 업데이트되며, HS가 탐색하는 동안 지속적으로 정확도가 향상된다.
실험에서는 표준 영상 시퀀스(예: ‘Foreman’, ‘Coastguard’)를 사용해 다양한 검색 반경(p=±7, ±15)에서 성능을 평가하였다. 결과는 PSNR 감소량이 0.2 dB 이하이면서 연산 횟수가 FSA 대비 80 % 이상 감소함을 보여준다. 또한 기존의 Fast Diamond Search와 비교했을 때, 동일한 PSNR 손실 조건에서 탐색 횟수가 평균 30 % 더 적었다. 이는 HS가 전역 탐색 능력을 유지하면서도 근사 모델을 통해 비용 계산을 효율화했기 때문이다.
한계점으로는 근사 모델의 초기 학습 비용과 파라미터 설정이 영상 특성에 민감할 수 있다는 점이다. 또한 HS의 파라미터(HM, HMCR, PAR)를 최적화하지 않으면 탐색 효율이 급격히 떨어질 수 있다. 향후 연구에서는 적응형 파라미터 조정, 다중 스케일 탐색, 그리고 하드웨어 구현을 위한 고정 소수점 설계 등을 제안한다.