구텐베르크 42줄 성경 활자 매트릭스 다중성 분석
초록
구텐베르크 42줄 성경의 한 페이지에 인쇄된 문자들을 정량적으로 측정하고, 군집분석과 이상치 검정을 결합해 ‘i’와 ‘a’ 두 글자를 대상으로 매트릭스가 여러 개 사용되었음을 통계적으로 입증하였다. 이는 기존의 “문자당 하나의 매트릭스” 가설을 부정한다.
상세 분석
본 논문은 구텐베르크 42줄 성경 인쇄 과정에서 사용된 금속 활자 매트릭스가 하나가 아니라 여러 개 존재한다는 가설을 검증하기 위해, 실제 인쇄된 문자 표본의 형상 차이를 정량화하고 통계적 군집분석을 적용한 점에서 학제간 연구의 모범을 제시한다. 먼저 저자들은 단일 페이지에서 ‘i’와 ‘a’ 두 글자를 각각 30여 개씩 추출하였다. 각 문자 이미지는 고해상도 스캔 후, 윤곽선 추출, 주요 특징점(예: 스트로크 굵기, 곡률, 세리프 형태) 등을 벡터화하고, 유클리드 거리와 형태학적 거리(프레셰 거리 등)를 결합한 복합 거리 행렬을 구축하였다.
‘i’에 대해서는 표본 수가 비교적 적어 정확한 최적 군집을 찾기 위해 전수 탐색 기반의 계층적 군집법(complete linkage)을 적용하였다. 이 과정에서 실루엣 계수와 실루엣 폭을 이용해 군집 수를 결정하고, 각 군집 내 평균 거리와 군집 간 평균 거리를 비교함으로써 군집의 구분 정도를 정량화하였다. 결과는 두 개 이상의 뚜렷한 군집이 존재함을 보여준다.
‘a’는 표본이 더 많아 계산 복잡도가 급증하므로, 저자들은 근사적인 응집형 군집법(agglomerative clustering with Ward’s method)을 사용하였다. 이때도 군집 수 선정에 실루엣 분석과 GAP 통계량을 병행했으며, 최종적으로 세 개 이상의 군집이 통계적으로 유의미하게 구분됨을 확인하였다.
군집 결과의 신뢰성을 검증하기 위해, 각 군집 내에서 가장 중심에 위치한 표본을 기준으로 다른 표본들의 거리 분포를 검토하고, Dixon’s Q test와 Grubbs’ test를 활용해 이상치(극단적인 형태 차이)를 식별하였다. 이상치 비율이 전체 표본의 5% 이하로 제한되었으며, 이는 군집이 실제 물리적 매트릭스 차이에 기반한다는 가설을 강하게 뒷받침한다.
통계적 유의성 검증에서는 부트스트랩 재표본추출을 통해 군집 구조의 안정성을 10,000번 반복했으며, p‑값이 0.001 이하로 나타나 “우연에 의한 군집 형성” 가능성을 거의 배제하였다. 이러한 결과는 기존의 “문자당 하나의 매트릭스”라는 전통적 견해에 반하는 강력한 증거를 제공한다.
연구는 또한 인쇄 기술사적 함의를 논의한다. 다중 매트릭스 사용은 구텐베르크가 초기 인쇄 공정에서 활자 제작 효율성을 높이기 위해 동일 문자에 대해 여러 개의 매트릭스를 동시에 운용했을 가능성을 시사한다. 이는 매트릭스 손상, 마모, 혹은 인쇄 품질 조절을 위한 의도적 변형 등 다양한 운영상의 이유와 연결될 수 있다.
마지막으로, 본 연구는 디지털 인문학과 통계학적 방법론이 결합될 때, 고전 인쇄물의 물리적 제작 과정을 미시적으로 재구성할 수 있음을 보여준다. 향후 다른 문자와 페이지, 혹은 다른 초기 인쇄물에 대한 확대 적용을 통해 인쇄 초기 단계의 기술적 다양성을 보다 정밀하게 파악할 수 있을 것으로 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기