근사 카르테시안 트리 매칭: 대체 허용 효율 알고리즘

근사 카르테시안 트리 매칭: 대체 허용 효율 알고리즘
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

텍스트 T와 패턴 P에 대해, 패턴의 카르테시안 트리와 동일한 트리를 갖는 문자열과 Hamming 거리 ≤ k인 모든 길이‑m 구간을 찾는 문제를 다룬다. 저자는 k ≤ m¹ᐟ⁵인 경우 O(n √m·k²·⁵), k ≥ m¹ᐟ⁵인 경우 O(n k⁵)의 시간 복잡도를 갖는 알고리즘을 제시해, 기존 O(n m k) 알고리즘보다 k = o(m¹ᐟ⁴) 구간에서 다항식 수준으로 빠르게 만든다. 핵심은 “CT‑블록‑주기성”이라는 새로운 주기 개념과 문자열‑카르테시안 트리 매칭에 대한 기존 조합·알고리즘 결과를 확장한 도구 상자이다.

상세 분석

본 논문은 카르테시안 트리 매칭의 근사 버전을 정의하고, 이를 효율적으로 해결하는 두 단계 알고리즘을 제시한다. 먼저, 정확 매칭이 문자열의 순서 관계만을 보존한다는 사실을 이용해 CT‑매칭을 “substring‑consistent equivalence relation”으로 정의하고, 이를 기반으로 Hamming 거리 k 이하의 근사 매칭을 CHdₖ(T


댓글 및 학술 토론

Loading comments...

의견 남기기