시맨틱 네트워크에서 문법 기반 최단경로 계산
초록
본 논문은 RDF 기반 시맨틱 네트워크에서 전통적인 단일 관계 그래프의 최단경로 개념을 확장한다. 사용자는 “문법”(grammar)이라는 추상 경로 기술자를 정의해, 의미적 제약을 만족하는 경로만을 탐색하도록 워커를 제어한다. 이를 통해 기존의 반경, 지름, 중심성 등 지오데식 메트릭을 시맨틱 웹에 적용할 수 있는 일반 프레임워크를 제시한다.
상세 분석
이 연구는 그래프 이론에서 가장 기본적인 개념인 최단경로(geodesic)를 다중관계, 즉 라벨이 있는 에지들로 구성된 시맨틱 네트워크에 어떻게 적용할 수 있는지를 체계적으로 탐구한다. 기존의 단일관계 네트워크에서는 모든 에지가 동일한 의미를 갖기 때문에, 최단경로를 찾는 알고리즘(예: 다익스트라, BFS)만으로도 충분했다. 그러나 시맨틱 네트워크에서는 에지 라벨이 관계의 종류를 명시하고, 라벨마다 도메인·레인지 제약이 존재한다. 따라서 “짧다”는 개념만으로는 의미적 타당성을 보장할 수 없으며, 경로 탐색 과정에 의미적 필터링이 필요하다.
논문은 이를 해결하기 위해 “워커(walker)”와 “문법(grammar)”이라는 두 개념을 도입한다. 워커는 그래프를 순회하는 가상의 탐색자이며, 문법은 허용 가능한 라벨 시퀀스와 정점 타입을 정의하는 규칙 집합이다. 구체적으로, 문법 Ψ는 RDF/ RDFS 온톨로지의 클래스와 프로퍼티에 대한 도메인·레인지 제약을 활용해, 워커가 특정 라벨을 따라 이동할 수 있는지 여부를 판단한다. 이때 문법은 정규 표현식과 유사한 형태로 기술될 수 있어, 복잡한 경로 패턴(예: “친구 관계를 따라가되, 중간에 조직 직원 노드가 반드시 포함되어야 함”)을 손쉽게 정의한다.
수학적으로는 기존의 경로 함수 ρ:V×V→Q 를 확장해 ρ:V×V×Ψ→Q 로 만든다. 즉, 두 정점 사이에 존재하는 모든 경로 중 문법 Ψ를 만족하는 경로 집합만을 반환한다. 이 정의를 기반으로 기존의 지오데식 메트릭—최단경로 길이 s(i,j), 편심도 e(i), 반경 r, 지름 d, 근접성 c(i), 매개 중심성 b(i)—을 그대로 재사용할 수 있다. 핵심은 “최단경로”가 이제 “문법을 만족하는 최단경로”가 된다는 점이다.
또한 논문은 이 모델을 기존의 확률적 그래프 분석(예: PageRank, eigenvector centrality)과도 연계한다. 이전 연구
댓글 및 학술 토론
Loading comments...
의견 남기기