문법 압축 문자열의 랜덤 접근: 거의 모든 파라미터 구간에서 최적 트레이드오프

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 문자열을 직선문법(SLG)으로 압축했을 때, 데이터 구조 크기 M과 쿼리 시간 사이의 최적 trade‑off를 제시한다. M이 g·log n 보다 크고 n·log σ 보다 작을 경우, O(M) 공간에 O!\big(\frac{\log (n·log σ / M·w)}{\log (M·w / g·log n)}\big) 시간에 랜덤 접근을 지원한다. 또한 거의 모든 파라미터 영역에서 이와 일치하는 하한을 증명한다.

상세 분석

이 연구는 기존에 n에만 의존하던 시간‑공간 분석을 넘어, 문자열 길이 n, 문법 크기 g, 알파벳 크기 σ, 워드 사이즈 w, 그리고 사용자가 할당할 수 있는 메모리 M을 모두 변수로 삼아 일반적인 상한식을 도출한다. 핵심은 “컨트랙팅 문법”을 확장한 새로운 변환 기법이다. 원문 문법을 단계적으로 압축하면서 각 변수 A가 파생하는 문자열 길이가 부모의 절반 이하가 되도록 제한한다(계약 문법). 이렇게 하면 전체 변수 수는 O(g)로 유지되면서, 시작 심볼 S의 오른쪽 부분을 길이 Θ(g·log n) 이하인 심볼 열로 재구성할 수 있다. 이 열에 대해 전통적인 순위(rank) 쿼리를 수행하면, 원하는 문자 위치를 O(log τ n) 단계 안에 찾을 수 있다. 여기서 τ는 M·w / (g·log n) 의 로그 기반 비율이며, 최종 쿼리 시간은
\

문법 압축 문자열의 랜덤 접근: 거의 모든 파라미터 구간에서 최적 트레이드오프

초록

상세 분석

댓글 및 학술 토론

의견 남기기