이진 알파벳으로 커버 배열에서 문자열을 선형 시간에 복원

본 논문은 최소 크기의 알파벳, 즉 두 글자만을 사용해 주어진 커버 배열로부터 원 문자열을 선형 시간에 복원하는 알고리즘을 제시한다. 커버 배열과 보더 배열 사이의 관계를 이용하고, 배열을 최소‑커버 형태로 정제한 뒤 연결 그래프를 구성해 컴포넌트별로 문자 ‘a’와 ‘b’를 할당한다. 알고리즘은 O(n) 시간·공간을 보장한다.

저자: Tanaeem M. Moosa, Sumaiya Nazeen, M. Sohel Rahman

이진 알파벳으로 커버 배열에서 문자열을 선형 시간에 복원
본 논문은 문자열 정규성 중 하나인 “커버”에 초점을 맞추어, 주어진 커버 배열으로부터 원 문자열을 최소 크기의 알파벳, 즉 두 글자만을 사용해 복원하는 문제를 다룬다. 서론에서는 문자열 반복 구조가 알고리즘 설계와 데이터 압축, 생물정보학 등 다양한 분야에서 핵심 역할을 함을 언급하고, 기존 연구들—KMP의 보더 배열, Boyer‑Moore, 최소‑커버·최대‑커버 배열 계산, 문자열 복원 문제 등—을 정리한다. 특히, 이전에 Crochemore 등(2011)이 제시한 “커버 배열이 유효한지 검증하고, 무한 알파벳으로 문자열을 생성”하는 방법과, Tomohiro 등(2020)의 파라미터화 보더 배열 검증 연구를 언급하며, 현재 연구가 그 한계를 넘어 최소 알파벳(2)으로 복원한다는 점을 강조한다. 다음 섹션에서는 기본 용어와 정의를 상세히 제시한다. 문자열 x, 알파벳 Σ, 접두사·접미사·프리픽스·서픽스·보더·커버 등을 정의하고, 최소‑커버 배열 C

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기