컴퓨팅 시대의 중국 고문서학: AI와 디지털 생태계
초록
본 논문은 인공지능을 활용한 중국 고문서학(고대 한자 연구)의 현재와 미래를 조망한다. 데이터셋 정리, 이미지 복원·문자 인식 등 시각 처리부터 파편 재결합·연대 측정, 자동 해독까지의 파이프라인을 제시하고, 전통적인 컴퓨터 비전에서 트랜스포머·멀티모달 모델로의 기술 전이를 분석한다. 데이터 부족, 인간 중심 연구와의 괴리 등 핵심 과제를 짚으며, 다중모달·소수샷 학습·인간‑AI 협업 시스템을 통한 연구 지원 로드맵을 제안한다.
상세 분석
이 논문은 중국 고문서학을 “시각‑맥락‑추론” 3단계 파이프라인으로 구조화하고, 각 단계별 기술 현황과 한계를 상세히 검토한다. 첫 번째 단계인 시각 처리에서는 고해상도 이미지 복원, 잡음 제거, 그리고 고대 문자에 특화된 데이터 증강 기법을 강조한다. 기존의 전통적 특징 추출(Canny, SIFT 등)에서 CNN 기반 초해상도와 Diffusion 모델을 활용한 복원으로 전환하고 있으며, 특히 Oracle Bone, 청동, 대나무 슬립 등 서로 다른 매체의 특성을 반영한 멀티스케일 네트워크 설계가 필요함을 지적한다.
두 번째 단계인 맥락 분석에서는 파편 재결합(fragment rejoining)과 중복 제거, 연대 측정이 핵심 과제로 제시된다. 여기서는 그래프 기반 매칭 알고리즘과 시계열 모델을 결합해 물리적 파편의 형상·재질·문자 패턴을 통합적으로 고려한다. 또한, 대나무 슬립 텍스트의 경우, 트랜스포머 기반 언어 모델을 이용해 문맥적 연속성을 복원하고, 연대별 문자 변천을 학습하는 “시대화(Periodization) 분류” 모델을 제안한다.
세 번째 단계인 고급 추론에서는 지식 그래프 구축, 자동 해독(automated decipherment), 인간‑AI 협업 시스템을 다룬다. 논문은 기존의 문자‑음‑의미 일대일 매핑이 한계임을 지적하고, radical‑level(부수) 구조와 음소‑의미 관계를 동시에 학습하는 멀티태스크 트랜스포머를 제안한다. 또한, 대규모 멀티모달 모델(예: CLIP, Flamingo)과 결합해 이미지와 텍스트를 교차 검증함으로써 불확실한 문자에 대한 ‘가능성 집합’을 제시하고, 학자가 직접 검증·수정할 수 있는 인터페이스 설계가 필요하다고 주장한다.
핵심 도전 과제로는 (1) 데이터 희소성: 고대 문자 이미지와 라벨이 극히 제한적이며, 라벨링 비용이 높다. 이를 해결하기 위해 few‑shot, meta‑learning, 그리고 합성 데이터 생성(Diffusion 기반) 전략을 강조한다. (2) 인간 중심 연구와 AI 사이의 괴리: 현재 AI는 시각 형태에 집중하지만, 고문서학은 음운·의미·역사적 맥락을 종합한다. 따라서 ‘인간‑AI 시너지’를 목표로, AI가 제안·보조 역할을 하고 학자가 최종 판단을 내리는 협업 워크플로우가 필수적이다.
마지막으로, 논문은 향후 연구 로드맵을 제시한다. 멀티모달 대규모 사전학습 모델을 고대 문자에 맞게 파인튜닝하고, 소수샷 학습을 통해 새로운 파편이나 미해독 문자에 빠르게 적용한다. 또한, 오픈소스 데이터베이스와 API 기반 협업 플랫폼을 구축해 학계·고고학·컴퓨터 비전 연구자 간의 지속적 교류를 촉진한다. 이러한 방향은 단순 자동화가 아니라, 학술적 통찰을 증폭시키는 ‘디지털 연구 생태계’를 구축하는 데 초점을 맞춘다.
댓글 및 학술 토론
Loading comments...
의견 남기기