다차원 역유클리드 거리 변환 및 분리 가능한 중간축 최적 알고리즘

초록

이 논문에서는 이진 영상에서 거리 변환(DT)과 기하학적 스켈레톤 추출을 위한 최적의 시간 복잡도를 갖는 알고리즘을 제시한다. 제안된 방법은 $d$ 차원 영상에 대해 역유클리드 거리 변환과 가역적인 중간축 추출 문제를 해결하며, 재구성된 형태의 품질을 조절할 수 있는 $d$ 차원 중간축 필터링 절차도 함께 제공한다.

상세 요약

거리 변환은 이미지 처리와 컴퓨터 비전에서 형태 분석의 기본 도구이며, 특히 유클리드 거리 변환은 픽셀(또는 보셀) 간의 실제 기하학적 거리를 제공한다. 전통적인 DT는 입력 이미지에서 전경 픽셀에 대해 가장 가까운 배경 픽셀까지의 거리를 계산하지만, 역유클리드 거리 변환(RDT)은 주어진 거리 맵으로부터 원본 이진 형태를 복원하는 문제이다. 이 역문제는 단순히 거리 값을 역으로 적용하는 것이 아니라, 거리 값이 만족해야 하는 기하학적 제약(예: 삼각 부등식)과 형태의 연결성을 동시에 고려해야 하므로 알고리즘 설계가 복잡하다.

또한 스켈레톤, 즉 중간축은 형태를 최소한의 구조로 압축하면서도 원래 형태를 복원할 수 있는 정보를 담고 있다. 기존의 중간축 추출 방법은 종종 차원에 종속적인 복잡도를 가지며, 필터링 단계에서 잡음에 민감하거나 재구성 오류가 발생한다. 저자들은 이러한 문제를 해결하기 위해 “분리 가능한(separable)” 접근법을 채택한다. 즉, $d$ 차원 공간을 각각의 1차원 축으로 분해하여 1차원 거리 변환과 역변환을 순차적으로 수행함으로써 전체 연산을 $O(N)$(여기서 $N$은 전체 픽셀 수) 시간에 마칠 수 있다. 이 방식은 메모리 접근 패턴을 최적화하고, 현대 CPU의 캐시 친화성을 높여 실제 실행 속도에서도 큰 이점을 제공한다.

알고리즘의 핵심은 두 단계로 구성된다. 첫 번째 단계는 각 축에 대해 1차원 유클리드 거리 변환을 수행하고, 이를 이용해 다차원 거리 맵을 구성한다. 두 번째 단계에서는 동일한 축 분리를 이용해 역변환을 수행하는데, 이때 거리 값이 만족해야 하는 삼각 부등식과 최소 거리 조건을 검증하면서 원본 이진 마스크를 복원한다. 이 과정에서 중간축을 동시에 추출할 수 있으며, 추출된 중간축은 “가역성(reversibility)”을 보장한다는 점이 특징이다.

추가로 제안된 $d$ 차원 중간축 필터링 과정은 사용자 정의 파라미터에 따라 중간축의 굵기와 복원 정확도를 조절한다. 필터링은 거리 값의 기울기와 곡률 정보를 활용해 잡음에 의해 발생하는 얇은 가지(branch)를 제거하고, 의미 있는 구조만을 남긴다. 따라서 최종 재구성된 형태는 원본과 거의 동일한 볼륨과 표면 특성을 유지하면서도, 메모리와 연산량을 크게 절감한다.

이 논문의 기여는 크게 세 가지로 요약할 수 있다. 첫째, 역유클리드 거리 변환과 가역 중간축 추출을 동시에 수행하는 시간 최적 알고리즘을 제시함으로써 기존 방법 대비 이론적 복잡도를 $O(N)$ 로 낮췄다. 둘째, 완전한 차원 독립성을 확보한 분리 가능한 설계로 다양한 차원(2D, 3D, 그 이상)에서 동일한 코드 베이스로 적용 가능하게 하였다. 셋째, 품질 제어가 가능한 중간축 필터링 기법을 도입해 실제 응용(의료 영상, 3D 모델링, 로봇 비전 등)에서 요구되는 정밀도와 효율성을 동시에 만족시켰다. 향후 연구에서는 이 알고리즘을 GPU 및 병렬 컴퓨팅 환경에 이식하고, 비유클리드 메트릭(예: 맨해튼 거리)에도 확장하는 방안을 모색할 수 있다.

초록

상세 요약

📜 논문 원문 (영문)