그래프철학 사서오경 지식그래프 구축과 디지털 인문학

** 본 논문은 《사서오경》과 그 베트남어‑중국어 주석을 대상으로, 다층 온톨로지를 기반으로 한 지식그래프(그래프철학)를 설계·구축한다. 자연어 처리·다언어 의미 임베딩·인문학적 해석을 결합해 텍스트·언어·개념·주석·발언자 등 6개의 레이어를 연결하고, 교차언어 검색·AI 보조 추론·시각화 인터페이스를 제공한다. 초기 사용자 실험에서 학습 효율과 문화적 이해도가 향상된 것으로 나타났다. **

저자: Minh-Thu Do, Quynh-Chau Le-Tran, Duc-Duy Nguyen-Mai

그래프철학 사서오경 지식그래프 구축과 디지털 인문학
** 본 논문은 동아시아 사상사에서 핵심적인 위치를 차지하고 있는 《사서오경》(대학·중용·논어·맹자)을 디지털 인문학적 관점에서 재조명한다. 기존의 디지털화 작업은 주로 원문 보존·검색에 초점을 맞추었으며, 번역·주석 등 다층적 해석 구조를 충분히 반영하지 못했다. 이러한 한계를 극복하고자 저자들은 ‘Graphilosophy’라 명명한 다층 온톨로지 기반 지식그래프 프레임워크를 설계·구현하였다. **데이터 구축** 연구는 베트남어‑중국어 주석서(Tran 2017)를 주요 자료원으로 삼아, 세 가지 핵심 컴포넌트(본문, 사전, 전문가 분석)로 구성된 2,222문장·5,344개 사전 항목·80개 주석을 포함하는 데이터셋을 만든다. 전처리 단계에서는 PaddleOCR을 이용해 스캔본을 텍스트화하고, 레이아웃 정규화·메타데이터(책·장·구절) 부착을 수행한다. 이후 삼중 병렬 정렬(한문‑한자음‑베트남어)과 사전‑본문 매핑을 자동화하고, 전문가 검수를 통해 정렬 오류와 의미 왜곡을 최소화한다. 최종적으로 16,468개의 노드와 71,249개의 관계(edge)로 이루어진 온톨로지‑구동 KG가 생성된다. **온톨로지 설계 및 레이어 구조** 온톨로지는 텍스트, 언어, 개념, 주석, 발언자, 의미의 6개 레이어로 구분된다. 각 레이어는 독립적인 스키마와 속성을 가지며, ‘hasTranslation’, ‘explains’, ‘belongsToConcept’ 등 도메인‑특화 관계를 통해 상호 연결된다. 예를 들어, ‘仁(인)’이라는 개념 노드는 텍스트 레이어의 구절과 사전 레이어의 정의, 주석 레이어의 해설, 그리고 베트남어 번역 노드와 모두 연결된다. 이러한 설계는 번역·주석·해석이 시간·문화·학파에 따라 변동될 수 있음을 구조적으로 반영한다. **AI·NLP 통합** 다언어 의미 임베딩을 위해 XLM‑R 및 multilingual BERT를 활용하고, 개념 간 유사도 계산 및 클러스터링에 적용한다. 구글 Gemini를 백엔드로 하는 자연어 질의 인터페이스는 사용자가 “인(仁)의 의미가 시대별로 어떻게 변했는가?”와 같은 질문을 입력하면, 온톨로지‑가이드된 SPARQL 쿼리로 변환해 결과를 시각화한다. 시각화는 그래프 뷰, 타임라인, 개념 맵 등으로 제공되어 사용자가 레이어 간 연결성을 직관적으로 탐색할 수 있게 한다. **편향 완화와 다원성** 그래프는 모듈식 설계로 새로운 번역·주석을 손쉽게 추가·버전 관리할 수 있다. 이는 특정 학파·국가 중심의 해석이 그래프 전체를 장악하는 것을 방지한다. 또한, 각 레이어는 독립적인 업데이트가 가능하므로, 학술적 논쟁이나 새로운 연구 결과가 발생했을 때 그래프 구조 자체를 재구성하지 않고도 반영할 수 있다. **사용자 연구** 예비 사용자 연구에서는 인문학 전공 대학생(30명)과 일반 사용자(20명)를 대상으로 시스템 사용 전·후의 개념 이해도와 학습 효율을 측정했다. 결과는 그래프 기반 탐색이 전통적인 텍스트 독해에 비해 개념 간 연계 인식 점수가 평균 27% 상승했으며, 학습 시간은 18% 단축되었다는 점을 보여준다. 인터뷰에서는 “다양한 번역과 주석을 한눈에 비교할 수 있어 의미의 폭을 직접 체험했다”는 긍정적 피드백이 다수였다. **의의와 한계** 본 연구는 고전 철학 텍스트를 ‘데이터’가 아닌 ‘해석적 네트워크’로 재구성함으로써 디지털 인문학의 새로운 방향을 제시한다. 다층 온톨로지는 의미의 다원성을 구조적으로 보존하고, AI 기반 질의·시각화는 비전문가에게도 접근성을 높인다. 그러나 현재는 베트남어‑중국어 주석에 국한되어 있어, 다른 언어(일본어, 한국어, 영어 등)와의 확장이 필요하다. 또한, 자동 의미 추출·관계 추론 단계에서 여전히 인간 검수가 요구되는 점은 향후 자동화 수준을 높여야 할 과제로 남는다. **결론** ‘Graphilosophy’는 《사서오경》과 그 주석을 다층 지식그래프로 전환함으로써, 전통적 텍스트 보존을 넘어 해석·교육·연구에 실용적인 디지털 인프라를 제공한다. 코드와 데이터가 공개되어 있어 학계·교육 현장에서 재현·확장이 가능하며, 고전 철학을 현대 윤리·문화 논의와 연결하는 데 기여할 것으로 기대된다. **

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기