선형 시간에 숨겨진 클리크 찾기와 확률적 보강
초록
본 논문은 $G(n,\tfrac12,k)$ 모델에서 $k = \Theta(\sqrt{n})$ 크기의 숨겨진 클리크를 $O(n^{2})$ 시간 안에 찾으며, 실패 확률을 다항식 수준으로 낮추는 새로운 알고리즘을 제시한다. 기존 Feige‑Ron 방법이 2/3 성공률에 머물렀던 점을, 정밀한 차수 임계값 설정과 다중 샘플링 기법을 통해 고확률(예: $1-n^{-c}$)로 개선한다.
상세 분석
문제 설정은 $G(n,\tfrac12,k)$ 로, 무작위로 선택된 $k$개의 정점이 완전 연결된 클리크를 형성하고 나머지 모든 가능한 간선은 독립적으로 확률 $1/2$ 로 존재한다는 것이다. 이때 $k$가 $\Theta(\sqrt{n})$ 이상이면, 클리크 내부 정점들의 평균 차수가 외부 정점보다 약 $k/2$ 만큼 크게 된다. 기존의 스펙트럴 방법은 라플라시안 고유벡터를 이용해 이 차이를 탐지하지만, 구현 복잡도와 상수 팩터가 크다. Feige‑Ron 알고리즘은 “고차수 정점 추출 → 무작위 샘플링 → 후보 검증”이라는 3단계 절차를 사용해 $O(n^{2})$ 시간에 2/3 정도의 성공률을 보였다. 그러나 그 분석은 차수 분포의 꼬리 확률을 과도하게 보수적으로 추정해 성공 확률을 제한했다.
본 논문은 두 가지 핵심 아이디어로 이를 극복한다. 첫째, 차수 임계값을 $d_{\text{thr}} = \frac{n}{2}+ \alpha\sqrt{n\log n}$ 로 정밀하게 조정한다. 여기서 $\alpha$는 $k$와 $n$의 비율에 따라 선택되는 상수이며, Chernoff 경계와 베르누이 합의 정밀한 상한을 이용해 “숨겨진 클리크 정점은 거의 확실히 $d_{\text{thr}}$ 이상, 비클리크 정점은 $d_{\text{thr}}$ 이하”임을 보인다. 둘째, 단일 샘플링 대신 $t = O(\log n)$ 번의 독립적인 무작위 샘플을 수행하고, 각 샘플에서 얻은 후보 집합을 교집합하거나 다수결로 결합한다. 이렇게 하면 각 단계에서 발생할 수 있는 오류가 지수적으로 감소하고, 전체 실패 확률은 $n^{-c}$ 수준으로 억제된다.
알고리즘의 시간 복잡도는 다음과 같다. 차수 계산은 $O(n^{2})$ 로, 이후의 $t$ 번 샘플링과 후보 검증은 각각 $O(nk)$ 이하이며 $k = O(\sqrt{n})$ 이므로 전체는 $O(n^{2})$ 를 초과하지 않는다. 메모리 사용량도 인접 행렬을 한 번만 읽으면 되므로 $O(n^{2})$ 가 된다.
정리하면, 정교한 차수 임계값 설정과 다중 샘플링을 결합함으로써 기존 Feige‑Ron 방법의 성공률을 다항식 수준으로 끌어올렸으며, 구현 복잡도는 그대로 유지한다. 이 접근법은 $k \ge C\sqrt{n\log n}$ (상수 $C$ 충분히 큰 경우) 에 대해 보장되며, $k$ 가 $\sqrt{n}$ 에 가까울 때도 실험적으로 높은 정확도를 보인다.
댓글 및 학술 토론
Loading comments...
의견 남기기