언어 네트워크의 비가역성: 《소리와 분노》 텍스트에서 드러난 츠니스 분포
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
본 논문은 재배선 없이 확장된 바라바시 모델을 이용해 단어 네트워크의 차수 분포가 츠니스(q‑지수) 분포임을 이론적으로 증명하고, 워싱턴 포크너의 소설 《소리와 분노》 영문 원본과 러시아어 번역본을 대상으로 실증 분석한다. 최대우도법으로 추정한 비극성 파라미터 q값은 두 언어 모두 1.4~1.6 사이에 머물며, 번역 매핑에서도 q값 순서(qB > qT > qD > qK > qA)가 보존되는 것을 확인한다.
상세 분석
이 연구는 먼저 텍스트를 단어‑노드, 인접 단어 쌍을 엣지로 하는 방향성 없는 네트워크로 변환한다. 기존 바라바시 모델은 새 노드가 기존 노드에 선호적 연결을 할 때, 기존 노드의 차수에 비례하는 확률을 부여한다. 여기서는 재배선(rewiring) 과정을 배제하고, 초기 연결 수와 선호적 연결 강도를 조절하는 두 개의 파라미터(α, β)를 도입한 확장 모델을 사용한다. 이 모델을 확률론적으로 해석하면, 시간 t에서 차수 k를 가진 노드의 기대 빈도 P(k)는 비가역 통계역학에서 등장하는 츠니스 분포, 즉
\
댓글 및 학술 토론
Loading comments...
의견 남기기