중세 영어 운율 변동성 정량화

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

이 논문은 중세 영어의 두 대표 서사시, 《그린 나이트의 가웨인》과 《플라우만》에 나타나는 운율적 특징을 수치화한다. 문자열을 리만 다양체 위의 데이터로 간주하고 프레셰 평균·분산 개념을 적용해 각 시의 운율 변동성을 측정한다. 두 텍스트의 분산 비율을 F‑검정과 유사한 통계량으로 만들고, 부트스트랩·재표집을 통해 p‑값을 추정함으로써 두 시의 운율적 차이를 검증한다.

상세 분석

본 연구는 전통적인 정량시학이 갖는 한계를 보완하고자, 현대 통계학·기하학 이론을 고전 시 분석에 도입한다. 먼저 중세 영어 운율, 특히 전통적인 ‘alliterative verse’의 구조를 정의한다. 이 구조는 한 행을 두 개의 반구절(half‑line)로 나누고, 각 반구절에 강세음절이 두 개씩 존재하며, 첫 번째 강세음절과 두 번째 반구절의 첫 강세음절 사이에 음운적 일치(alliteration)가 발생한다는 규칙을 갖는다. 이러한 규칙을 문자열 형태로 코딩한 뒤, 각 행을 ‘패턴 문자열’로 변환한다. 예를 들어 “SYN‑syn‑syn‑syn”과 같이 강세·비강세·음절 길이를 기호화한다.

다음으로 저자는 문자열 간 거리를 측정하기 위해 편집거리(edit distance, Levenshtein distance)를 채택한다. 편집거리는 삽입·삭제·치환 연산의 최소 비용을 의미하며, 이는 리만 다양체 상의 거리 개념과 유사하게 작동한다. 이렇게 정의된 거리 함수를 이용해 프레셰 평균(Fréchet mean)과 프레셰 분산(Fréchet variance)을 계산한다. 프레셰 평균은 전체 데이터 집합에서 거리 합이 최소가 되는 ‘대표 문자열’을 의미하고, 프레셰 분산은 각 문자열이 평균 문자열과 얼마나 떨어져 있는지를 평균 제곱 거리로 나타낸다.

두 시의 프레셰 분산을 각각 구한 뒤, 그 비율을 F‑통계량의 아날로그로 사용한다. 전통적인 F‑검정은 두 정규분포의 분산 비율을 검정하지만, 여기서는 비정규적이고 이산적인 문자열 데이터에 적용한다. 따라서 정확한 p‑값을 얻기 위해 무작위 재표집(permutation test) 방식을 도입한다. 구체적으로는 두 시의 행을 합친 뒤, 무작위로 두 그룹으로 재분할하고 각 그룹의 프레셰 분산을 다시 계산한다. 이 과정을 수천 번 반복해 얻은 분산 비율의 경험적 분포에서 실제 관측된 비율이 차지하는 위치를 p‑값으로 정의한다.

실험 결과, 《그린 나이트의 가웨인》은 비교적 낮은 프레셰 분산을 보이며, 운율이 일정하고 규칙적인 패턴을 유지한다. 반면 《플라우만》은 높은 분산을 나타내어, 운율적 변동성이 크고 자유로운 형태를 띤다. 재표집 검정에서 얻은 p‑값은 0.01 이하로, 두 시 사이의 운율 변동성 차이가 통계적으로 유의함을 확인한다.

이러한 접근법은 기존의 정성적 분석을 보완하고, 대규모 텍스트 코퍼스에 대한 자동화된 운율 비교를 가능하게 한다. 다만 편집거리 외에도 음운학적 유사성을 더 정교하게 반영하는 거리 함수(예: 음소 기반 거리)나, 강세 패턴을 더 세밀히 모델링하는 방법이 향후 연구 과제로 남는다. 또한 프레셰 평균이 반드시 실제 시에 존재하는 형태가 아닐 수 있다는 점에서, 평균 문자열을 해석하는 방법에 대한 추가 논의가 필요하다.

중세 영어 운율 변동성 정량화

초록

상세 분석

댓글 및 학술 토론

의견 남기기