선형 그래프에서 자주 나타나는 부분 그래프 탐색: LGM 알고리즘

선형 그래프는 정점이 완전히 순서화된 그래프를 말한다. 생물학적 및 언어적 시퀀스와 기호 간의 상호작용은 선형 그래프로 자연스럽게 표현된다. 예시에는 단백질 접촉 맵, RNA 2차 구조, 술어-인자 구조 등이 있다. 우리의 알고리즘인 선형 그래프 마이너(LGM)는 정점의 순서를 활용하여 자주 나타나는 부분 그래프를 효율적으로 열거한다. 역방향 탐색 원칙을

선형 그래프에서 자주 나타나는 부분 그래프 탐색: LGM 알고리즘

초록

선형 그래프는 정점이 완전히 순서화된 그래프를 말한다. 생물학적 및 언어적 시퀀스와 기호 간의 상호작용은 선형 그래프로 자연스럽게 표현된다. 예시에는 단백질 접촉 맵, RNA 2차 구조, 술어-인자 구조 등이 있다. 우리의 알고리즘인 선형 그래프 마이너(LGM)는 정점의 순서를 활용하여 자주 나타나는 부분 그래프를 효율적으로 열거한다. 역방향 탐색 원칙을 기반으로 패턴 공간을 체계적으로 탐색하면서 중복 확인에 따른 비용을 절감한다. 선형 그래프의 순차적 특성 때문에 불연결된 부분 그래프 패턴이 특히 중요하다. LGM은 연결된 패턴만 검출하는 전통적인 그래프 마이닝 알고리즘과 달리, 불연결된 패턴도 검출할 수 있다. 단백질 접촉 맵에 대한 실험을 통해 LGM의 효용성과 효율성이 입증된다.

상세 요약

이 논문은 선형 그래프에서 자주 나타나는 부분 그래프를 탐색하는 알고리즘인 LGM(Linear Graph Miner)을 제안한다. 이 연구는 생물학적 및 언어학적 시퀀스와 그 상호작용을 표현하기 위해 사용되는 선형 그래프에 초점을 맞추고 있다. 특히 단백질 접촉 맵, RNA 2차 구조, 술어-인자 구조 등이 이러한 예시로 제시된다.

LGM 알고리즘의 핵심은 정점의 순서를 활용하여 자주 나타나는 부분 그래프를 효율적으로 열거하는 것이다. 이 과정에서 역방향 탐색 원칙을 적용함으로써 패턴 공간을 체계적으로 탐색하면서 중복 확인에 따른 비용을 줄일 수 있다. 이러한 접근법은 기존의 그래프 마이닝 알고리즘과는 달리, 선형 그래프의 특성상 중요한 불연결된 부분 그래프 패턴도 검출할 수 있게 한다.

실험 결과를 통해 LGM의 효용성과 효율성이 입증되었으며, 특히 단백질 접촉 맵에 대한 분석에서 그 성능이 확인되었다. 이 연구는 생물학적 및 언어학적 데이터에서 복잡한 패턴을 효과적으로 탐색하고 이해하는 데 중요한 도구를 제공한다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...