그래프 대칭 탐지와 정규 라벨링 차이점과 시너지

그래프 대칭 탐지와 정규 라벨링 차이점과 시너지

초록

본 논문은 그래프 대칭 탐지와 정규 라벨링이라는 두 문제를 비교·분석하고, 대칭 정보를 먼저 찾은 뒤 이를 정규 라벨링에 활용하는 새로운 알고리즘을 제안한다. 실험 결과, 제안 방법이 기존 최첨단 정규 라벨러보다 전반적으로 더 빠르고 안정적인 성능을 보인다.

상세 분석

본 연구는 조합 객체의 대칭성이 탐색 알고리즘에 미치는 부정적 영향을 최소화하기 위한 두 핵심 기술, 즉 대칭 탐지(symmetry detection)와 정규 라벨링(canonical labeling)을 심층적으로 비교한다. 대칭 탐지는 객체의 자동 동형군(automorphism group)을 찾는 과정으로, 대표적으로 NAUTY, SAUCY, BLISS와 같은 툴이 있다. 이들 툴은 그룹 생성과 정규형 탐색을 효율적으로 수행하지만, 결과를 정규 라벨 형태로 변환하는 기능은 제한적이다. 반면 정규 라벨링은 객체를 고유한 문자열이나 인덱스로 변환해 동등성 검사를 O(1) 수준으로 단순화한다. 현재 상용·오픈소스 정규 라벨러(NAUTY의 정규 라벨링 모드, Traces, bliss)는 내부적으로 대칭 탐지를 수행하지만, 그 목적은 라벨링 가속화가 아니라 라벨 자체를 산출하는 데 있다.

알고리즘적 차이를 살펴보면, 대칭 탐지는 보통 색상 분할(color refinement)과 개별화(individualization) 단계에서 분기 한계를 최소화하는 전략을 사용한다. 정규 라벨링은 동일한 색상 분할 과정을 거치지만, 최종 목표가 “가장 작은(lexicographically minimal) 라벨”을 찾는 것이므로, 모든 가능한 개별화 경로를 탐색하거나, 강력한 pruning 규칙을 적용한다. 따라서 대칭 탐지는 그룹 구조를 완전하게 파악하려는 반면, 정규 라벨링은 최소 라벨을 찾는 데 집중한다는 점에서 목적 함수가 다르다.

이러한 차이를 활용해 저자들은 먼저 고성능 대칭 탐지 엔진을 이용해 자동 동형군을 신속히 추출하고, 얻어진 군의 궤도(orbit) 정보를 정규 라벨링 단계에 통합한다. 구체적으로, 개별화 후보를 선택할 때 이미 발견된 대칭에 의해 동일한 궤도에 속하는 정점들을 하나만 고려하도록 제한함으로써 분기 폭을 크게 감소시킨다. 또한, 군의 생성자(generators)를 이용해 라벨 후보들의 사전 순서를 비교할 때, 군 작용에 의해 동일하게 변환되는 라벨은 중복 계산을 피한다. 이러한 설계는 기존 정규 라벨러가 매번 전체 탐색 트리를 재구성하던 비효율성을 크게 개선한다.

실험에서는 표준 벤치마크(인간 설계 그래프, 회로 네트워크, 화학 구조 등)와 대규모 무작위 그래프를 대상으로 기존 NAUTY/Traces, bliss와 비교했다. 평균 실행 시간은 30%~45% 감소했으며, 특히 대칭도가 높은 그래프(예: 완전 그래프, 격자 그래프)에서 개선 폭이 60%에 육박했다. 메모리 사용량은 대칭 탐지 단계에서 생성되는 군 정보가 추가되지만, 전체 파이프라인에서의 증가율은 미미했다.

결론적으로, 대칭 탐지와 정규 라벨링은 서로 보완적인 관계에 있으며, 대칭 정보를 사전에 확보함으로써 정규 라벨링의 복잡도를 크게 낮출 수 있음을 입증한다. 향후 연구에서는 군 기반 프루닝을 더욱 정교화하고, 비그래프형 조합 객체(예: 하이퍼그래프, 텐서)에도 적용 가능한 일반화 프레임워크를 구축하는 방향을 제시한다.