확장 정규표현식 매칭의 새로운 고속 알고리즘

확장 정규표현식 매칭의 새로운 고속 알고리즘
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

이 논문은 문자열 Q와 확장 정규표현식 R의 매칭을 기존 O(n³k) 시간에서 행렬 곱셈 지수 ω≈2.37을 이용해 O(n^ω k) 시간으로, 공간은 O(n²) 로 개선한 알고리즘을 제시한다. 핵심은 “매치 그래프”라는 부울 행렬 표현과 파스 트리 클러스터링, 그리고 비확장 정규표현식 매칭 블랙박스를 결합한 새로운 기법이다.

상세 분석

논문은 먼저 Hopcroft‑Ullman이 제시한 O(n³m) 동적계획법을 재검토하고, 이를 빠른 행렬 곱셈으로 O(n^ω m) 시간·O(n²m/w) 공간으로 개선할 수 있음을 보인다. 그러나 확장 연산자(교집합·보완)가 포함된 경우 m 대신 연산자 수 k가 지배적이므로, 기존 최첨단인 Yamamoto‑Miyazaki의 O(n³k + n²m/w) 시간·O(n²k + nm/w) 공간보다 더 나은 복잡도를 목표로 한다.

핵심 아이디어는 “매치 그래프”라는 구조이다. 매치 그래프는 Q의 모든 구간


댓글 및 학술 토론

Loading comments...

의견 남기기