말라가시 방언의 계통과 정착 시기 재조명
초록
이 연구는 23개 방언의 200항 Swadesh 목록을 이용해 정규화 레벤슈타인 거리(LDN)를 계산하고, UPGMA와 Neighbor‑Joining 두 가지 계통수 방법으로 방언군을 재구성한다. 결과는 중앙‑동북부와 남서부의 두 주요 군으로 나뉘며, 언어적 다양성이 가장 높은 지역을 정착지로 추정해 약 서기 650년경 최초 정착이 이루어졌다고 제시한다.
상세 분석
본 논문은 말라가시 섬 전역에 걸친 23개 방언에 대해 200개 어휘로 구성된 Swadesh 리스트를 직접 수집한 점이 가장 큰 강점이다. 수집된 자료는 표준 정자법을 적용해 정규화 레벤슈타인 거리(LDN)를 산출했으며, 이는 단순한 동족어 카운팅을 넘어 삽입·삭제·대체 연산을 모두 고려한 정량적 척도이다. LDN 값을 200개 어휘에 대해 평균화함으로써 각 방언쌍 간의 전반적인 어휘·음운 차이를 수치화하였다.
계통수 재구성에는 두 가지 전통적인 알고리즘을 사용하였다. UPGMA는 모든 분기에서 동일한 진화 속도를 가정하므로, 거리 행렬이 균일하게 분포할 때 안정적인 결과를 제공한다. 반면 Neighbor‑Joining(NJ)은 속도 차이를 허용해 실제 언어 변화의 비대칭성을 반영한다. 두 방법 모두 거의 동일한 대분류—중앙‑동북부와 남서부—를 도출했으며, 이는 지리적 경계와도 일치한다. 다만 몇몇 방언(예: 마준가, 안다보베)의 위치가 알고리즘에 따라 다르게 배치되었는데, 이는 해당 방언들이 지리적·사회적 경계에 놓여 있어 언어적 혼합이 활발했음을 시사한다.
연구진은 또한 SCA(Structure Component Analysis)라는 차원 축소 기법을 적용해 방언 간의 기하학적 관계를 시각화하고, 최대 언어 다양성이 나타나는 지역을 ‘언어적 고향’으로 정의하였다. 이 지역은 현재의 중앙‑동북부에 해당하며, 여기서 파생된 방언들의 평균 LDN이 가장 낮았다. 고향 지역의 다양성 정도와 거리 행렬을 이용해 glottochronology 공식을 일반화한 모델로 연대 추정을 수행했으며, 결과는 약 서기 650년(± 약 50년)으로 나타났다. 이는 기존 문헌에서 제시된 1,000~2,000년 전 설과는 차이가 있지만, 해양 이동과 정착 시기의 범위를 좁히는 데 기여한다.
외부 비교에서는 말라가시어와 가장 근연인 마아니안(Maanyan)뿐 아니라 말레이어, 자와어 등 인도네시아·말레이시아 지역 언어와의 어휘 유사성을 ASJP 데이터베이스와 Austronesian Basic Vocabulary Database를 활용해 검증했다. 결과는 마아니안과의 기본 어휘 공유율이 가장 높지만, 말레이어와의 차용어도 일정 부분 존재함을 보여, 초기 정착 과정에서 다수의 인도네시아 해양 집단이 복합적으로 참여했을 가능성을 뒷받침한다.
전체적으로 이 논문은 정량적 거리 측정과 현대 계통학적 방법을 결합해 말라가시 방언의 내부 구조와 정착 시기를 재조명했으며, 기존 연구와의 차이점을 명확히 제시한다. 다만 LDN이 어휘·음운 변화를 동시에 반영하므로 의미 변천이나 차용어의 비중을 별도로 분석하지 않은 점은 향후 연구 과제로 남는다.
댓글 및 학술 토론
Loading comments...
의견 남기기