활성 규칙 기반 XML 문서 관리 시스템

활성 규칙 기반 XML 문서 관리 시스템

초록

본 논문은 전통적인 전자문서 관리 시스템(E-DMS)의 확장성·유연성 부족 문제를 해결하고자, 문서와 활성 규칙을 XML 형태로 통합 저장·실행하는 SIGED 시스템을 제안한다. 기존 SAGED와 달리 규칙과 문서가 동일한 XML 레이어에 존재해 문서 이동·교환 시 일관성 유지가 용이하며, 네이티브 XML 데이터베이스를 활용해 효율적인 규칙 추출·컴파일·실행 메커니즘을 구현한다.

상세 분석

이 논문은 기업 환경에서 기술 문서의 전 생애주기 관리가 필수적이라는 전제 하에, 현재 상용 전자문서 관리 시스템(EDMS)이 데이터 모델의 경직성으로 인해 확장과 개선이 어려운 점을 지적한다. 특히 문서 요소에 대한 세밀한 기술이 부족하고, 링크와 일관성 관리 메커니즘이 미비하다는 점을 비판한다. LIRIS 연구팀이 이전에 개발한 SAGED는 활성 규칙을 이용해 일관성을 관리했지만, 규칙과 문서 설명을 별도의 레이어에 두어 문서가 서버 간 이동하거나 교환될 때 규칙과 문서 사이의 결합이 깨지는 구조적 한계를 가지고 있었다.

본 연구는 이러한 한계를 극복하기 위해 “규칙을 XML 문서 기술에 통합”한다는 핵심 아이디어를 제시한다. 구체적으로, 문서와 규칙을 동일한 XML 스키마에 포함시켜 네이티브 XML 데이터베이스에 저장함으로써, 문서와 규칙이 물리적으로 동일한 저장소에 존재하도록 설계한다. 이를 통해 문서가 다른 서버로 복사·이동될 때 규칙도 자동으로 함께 이동하므로, 일관성 관리 로직이 손실되지 않는다.

시스템 아키텍처는 전형적인 클라이언트/서버 모델을 따르며, 서버 측에 “지능형 규칙 실행 컴포넌트”(Intelligent Component for Active Rules Execution, ICAR)를 배치한다. 클라이언트가 문서를 요청하면, ICAR는 해당 XML 문서에서 요소를 파싱해 규칙을 추출하고, 추출된 규칙을 내부 규칙 엔진에 전달한다. 규칙 엔진은 규칙을 중간 코드 형태로 컴파일한 뒤, 트리거 이벤트(예: 문서 삽입, 수정, 삭제)와 매핑하여 실행한다. 규칙 실행 결과는 문서의 메타데이터 혹은 내용 자체를 수정하는 형태로 피드백되며, 이는 다시 XML 데이터베이스에 저장된다.

핵심 기술적 기여는 다음과 같다. 첫째, XML 기반의 “규칙-문서 통합 스키마”를 정의해 규칙을 문서와 동등한 수준으로 다룬다. 둘째, 네이티브 XML DBMS(예: eXist-db, BaseX)를 활용해 XPath/XQuery 기반의 규칙 추출·컴파일 파이프라인을 구현한다. 셋째, 규칙 실행을 위한 이벤트 모델을 설계해 문서 변경 이벤트와 규칙 트리거를 효율적으로 연결한다. 넷째, 기존 SAGED와 비교해 규칙·문서 결합도가 높아짐에 따라 시스템 유지보수 비용이 감소하고, 문서 교환 시 일관성 손실 위험이 크게 낮아진다.

성능 평가에서는 규칙 추출·컴파일 단계가 문서 크기에 선형적으로 증가함을 확인했으며, 대규모 문서 집합(수십만 개)에서도 실시간 규칙 적용이 가능한 수준의 응답 시간을 기록했다. 또한, 규칙이 포함된 문서를 다른 서버로 복제했을 때, 복제된 환경에서도 동일한 일관성 검증이 자동으로 수행되는 것을 실험적으로 입증하였다.

이와 같이 SIGED는 문서 관리와 일관성 유지라는 두 축을 하나의 XML 기반 플랫폼에 통합함으로써, 기존 EDMS가 갖는 구조적 경직성을 해소하고, 기업 내·외부 문서 흐름을 보다 유연하고 신뢰성 있게 지원한다.