문학·음악 시퀀스의 의미 구분과 맥락 탐색

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 제이슨-샤논(Jensen‑Shannon) 발산을 이용한 구분 알고리즘을 연극 대본의 등장인물 시퀀스와 12음계 피아노 소나타의 음계 시퀀스에 적용한다. 알고리즘은 확률 분포 간 차이를 최대화하는 구간을 찾아내어, 연극에서는 인물 등장 빈도와 무대 배경 변화와 연관된 구간을, 소나타에서는 조성 전이와 tonal domain을 정밀하게 드러낸다.

상세 분석

이 연구는 두 가지 전형적인 상징적 시퀀스—연극 텍스트와 음악 악보—에 대해 동일한 통계적 구분 프레임워크를 적용함으로써, 비정형 데이터에 대한 보편적 분석 도구의 가능성을 제시한다. 핵심은 제이슨‑샤논(JSD) 발산을 이용해 연속적인 서브시퀀스의 확률 분포를 비교하고, 그 차이가 최대가 되는 지점을 경계점으로 설정하는 것이다. JSD는 Kullback‑Leibler 발산의 대칭화이면서 유한값을 보장하므로, 빈도 데이터가 희소하거나 0인 경우에도 안정적인 거리 측정이 가능하다.

연극 시퀀스의 경우, 각 등장인물은 고유한 심볼로 매핑되고, 텍스트를 시간 순서대로 스캔하면서 등장 인물의 출현 빈도를 윈도우 기반으로 추정한다. 윈도우 크기는 실험적으로 200~300 토큰 정도가 적절했으며, 이는 인물 간 상호작용이 충분히 포착될 수 있는 규모다. 구간 경계가 탐지되면, 해당 구간 전후의 인물 빈도 프로파일을 비교해 JSD 값을 계산하고, 국부 최대값을 경계점으로 채택한다. 결과적으로, 주요 전환점—예를 들어, 무대가 베니스에서 로마로 이동하거나, 새로운 주요 인물이 등장하는 장면—이 통계적으로 의미 있는 구분으로 드러난다. 이는 전통적인 문학 분석에서 ‘행위 전환’이나 ‘배경 전환’으로 해석되는 현상을 정량화한 사례라 할 수 있다.

음악 시퀀스에서는 12음계의 각 피치를 011의 정수로 코딩하고, 연주 데이터를 시간 순서대로 배열한다. 여기서는 음표의 지속시간을 무시하고 피치 순서만을 고려했으며, 이는 조성 구조를 파악하는 데 충분한 정보라고 가정한다. 윈도우 크기는 3040음표 정도가 적당했으며, 이는 한 구절 혹은 한 주제의 조성적 특성을 포착한다. 구간 경계가 탐지되면, 해당 구간의 피치 분포와 인접 구간의 분포 간 JSD를 계산한다. 높은 JSD 값은 조성 전이, 즉 새로운 tonal domain으로의 이동을 의미한다. 실험 결과, 소나타의 전통적인 형식(예: exposition, development, recapitulation)과 일치하는 구간이 자동으로 식별되었으며, 특히 development 부분에서 복합적인 조성 변화를 세밀하게 포착했다.

알고리즘의 장점은 파라미터(윈도우 크기, 최소 구간 길이 등)를 조정함으로써 다양한 시간·스케일에서 구조적 변화를 탐지할 수 있다는 점이다. 또한, JSD 기반 구분은 사전 지식이 없는 비전문가도 적용 가능하게 하여, 디지털 인문학·음악학 분야에서 자동화된 텍스트·음악 분석 파이프라인 구축에 기여한다. 한계점으로는 윈도우 크기에 대한 민감도가 존재하고, 매우 짧은 구간에서는 통계적 신뢰도가 떨어진다는 점이다. 향후 연구에서는 다중 스케일 분석과 베이지안 모델링을 결합해 이러한 문제를 보완하고, 음표의 리듬·다이내믹스 정보를 포함한 확장된 모델을 제안할 수 있다.

문학·음악 시퀀스의 의미 구분과 맥락 탐색

초록

상세 분석

댓글 및 학술 토론

의견 남기기