쌍거리로부터 정수 집합 복원: 희소성 기반 다항시간 알고리즘

초록

정수 집합의 모든 쌍거리 집합이 주어졌을 때, 원래 정수들을 (선형 이동 및 뒤집기 제외) 복원하는 문제를 다룬다. 기존에는 NP‑hard 여부도, 유일 복원 가능성도 미정이었지만, 정수들이 충분히 희소(간격이 큰)라는 가정을 추가하면, 희소성 정도가 (O(n^{1/2-\varepsilon})) 이하일 경우 확률적으로 1에 가까운 성공률을 보장하는 다항시간 알고리즘을 제시한다. 이론적 증명과 수치 실험을 통해 알고리즘의 정확성과 효율성을 확인하였다.

상세 분석

본 논문은 고전적인 ‘턴파이크 문제(Turnpike problem)’의 변형으로, 정수 집합 (X={x_1,\dots ,x_n})의 쌍거리 집합 (D={|x_i-x_j|;|;i<j})가 주어졌을 때 (X)를 복원하는 역문제를 다룬다. 기존 연구에서는 이 문제의 복잡도와 유일성에 대해 명확한 결론이 없었으며, 일반적인 경우는 지수시간 탐색이나 제한된 경우에만 다항시간 해법이 알려져 있었다. 저자들은 실용적인 응용 분야(예: DNA 시퀀싱, 무선 센서 네트워크, 초음파 거리 측정)에서 정수들이 자연스럽게 ‘희소’하다는 관찰에 착안한다. 구체적으로, 정수들 사이의 최소 간격이 (\Theta(n^{1/2-\varepsilon})) 이상이면, 거리 집합에 포함된 중복이 크게 감소하고, 그래프 기반의 매칭 구조가 거의 유일하게 결정된다. 이를 이용해 저자들은 다음과 같은 핵심 아이디어를 제시한다. 1) 가장 큰 거리 (d_{\max})는 원소 집합의 양 끝점 차이와 동일하므로, 이를 기준으로 좌우 대칭을 고정한다. 2) 남은 거리들을 ‘가능한 좌표 후보’로 변환하고, 후보 간의 충돌(중복 거리 발생)을 그래프의 간선으로 모델링한다. 3) 희소성 조건 하에서는 이 그래프가 거의 트리 구조에 가깝게 되며, 깊이 우선 탐색과 제한된 백트래킹만으로 유효한 좌표 배열을 찾을 수 있다. 4) 알고리즘은 각 단계에서 후보 집합을 O(n) 크기로 유지하므로 전체 시간 복잡도는 O(n^2)이며, 메모리 사용량도 O(n^2) 이하이다. 이론적 분석에서는 확률론적 결합론을 이용해, 정수들이 독립적으로 균등하게 배치될 경우 희소성 한계 이하에서 복원 성공 확률이 (1-O(n^{-\delta})) 형태로 수렴함을 증명한다. 또한, 선형 이동(전체 집합에 동일한 상수 추가)과 뒤집기(좌표 순서 반전)는 거리 집합에 영향을 주지 않으므로, 복원 결과는 이러한 변환에 대해 불변임을 명시한다. 실험 부분에서는 무작위로 생성한 희소 정수 집합과, 실제 물리 실험에서 얻은 거리 데이터 두 가지 시나리오를 테스트하였다. 모든 경우에서 제안 알고리즘은 기존의 완전 탐색 기반 방법보다 1~2자리 수의 시간 절감 효과를 보였으며, 복원 정확도는 99.9% 이상으로 유지되었다. 따라서, 희소성 가정이 현실적인 응용에 충분히 적용 가능함을 실증하였다.