스크립트 정량화: 문자 메트릭 정의와 활용
본 논문은 고대 문자 형태를 정량적으로 분석하기 위한 다양한 메트릭을 제시한다. 필기 동작 이론과 제스처 인식 기술을 기반으로, 획의 길이·곡률·압력·속도 등 30여 개의 지표를 정의하고, 이들을 서예학·디지털 고문서학에 적용한다. 제안된 메트릭을 중세 타밀 문자와 그 전신인 브라흐미 문자에 적용해 시계열 변화를 정량화함으로써, 서체 진화와 필사자의 특징을
초록
본 논문은 고대 문자 형태를 정량적으로 분석하기 위한 다양한 메트릭을 제시한다. 필기 동작 이론과 제스처 인식 기술을 기반으로, 획의 길이·곡률·압력·속도 등 30여 개의 지표를 정의하고, 이들을 서예학·디지털 고문서학에 적용한다. 제안된 메트릭을 중세 타밀 문자와 그 전신인 브라흐미 문자에 적용해 시계열 변화를 정량화함으로써, 서체 진화와 필사자의 특징을 객관적으로 파악한다.
상세 요약
이 논문은 전통적인 고문서학이 주로 정성적 서술에 의존해 온 점을 비판하고, 디지털 시대에 맞는 정량적 도구의 필요성을 강조한다. 저자는 먼저 손글씨 생성 메커니즘을 ‘획획(筆畫)’ 단위의 동작으로 분해하고, 이를 제스처 디자인 및 인식 분야에서 사용되는 파라미터와 매핑한다. 구체적으로, ‘시작점·끝점 좌표’, ‘획의 총 길이’, ‘곡률 변화율’, ‘속도 프로파일’, ‘압력 변동’, ‘시간 지속’ 등 12개의 기본 메트릭을 정의하고, 이들을 조합해 ‘획 복합도’, ‘구조 복잡도’, ‘대칭성 지표’, ‘연결성 점수’ 등 18개의 파생 메트릭을 도출한다.
특히, 저자는 기존 연구에서 간과된 ‘획 간 간격(Inter-stroke spacing)’과 ‘획 간 교차점(Stroke intersection)’을 정량화하는 새로운 지표를 제안한다. 이는 서체의 밀도와 교차 복잡성을 수치화해, 서로 다른 시대·지역·필경자 간의 미세한 차이를 드러내는 데 유용하다. 또한, ‘동작 일관성(Stroke Consistency)’ 지표는 동일 필경자가 동일 문자에 대해 보이는 변동성을 측정함으로써, 개인 서체 특성을 정량화한다.
메트릭의 신뢰성을 검증하기 위해, 저자는 500여 개의 중세 타밀 문자 이미지와 그 대응 브라흐미 문자 표본을 수집하고, 자동 전처리(노이즈 제거·이진화·벡터화)를 거쳐 메트릭을 계산한다. 결과는 주성분 분석(PCA)과 군집 분석을 통해 시각화되며, 시간 축을 따라 메트릭 값이 점진적으로 변하는 패턴이 관찰된다. 예를 들어, ‘곡률 평균’과 ‘획 길이 평균’은 초기 브라흐미 단계에서 높은 변동성을 보이다가, 중세 타밀 단계에서는 안정화되는 경향을 보인다. 이는 필체가 점차 표준화되는 과정을 정량적으로 뒷받침한다.
또한, 저자는 메트릭 기반 분류 모델(랜덤 포레스트, SVM)을 구축해 시대 구분 정확도를 92% 이상 달성했으며, 이는 기존의 시각적 비교 방식보다 현저히 높은 성능이다. 이러한 결과는 제안된 메트릭이 서체 진화와 필경자 식별에 실용적인 특징을 제공함을 입증한다.
논문의 한계로는 메트릭이 이미지 품질에 민감하고, 손글씨의 3차원 압력·속도 정보를 2차원 스캔 이미지에서 완전히 복원하기 어렵다는 점을 들었다. 향후 연구에서는 디지털 펜 입력 데이터와 결합해 압력·속도 정보를 직접 측정하거나, 딥러닝 기반 특징 추출과 메트릭을 융합해 보다 강건한 서체 분석 프레임워크를 구축할 것을 제안한다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...