선호 부착 트리의 잎과 차수의 숨은 관계
초록
본 논문은 전통적인 차수 분포를 넘어, 각 정점의 잎수(leaf‑degree)를 함께 고려한 공동 차수‑잎수 분포 (n_{k,\ell}) 를 정의하고, 이를 다변량 생성함수로부터 정확히 구한다. 선호 부착(PA) 트리에서 (n_{k,\ell})를 이용해 잎수 분포 (m_\ell)가 (\ell^{-3}) 꼬리를 가지는 것을 보였으며, 보호된 정점(leaf‑degree 0인 비잎)의 비율 (p\approx0.039447)와 차수별 보호 비율 (n_{k,0}) 등을 얻었다. 또한 (N_{k,\ell})의 확률적 변동을 분석해 자기 평균화와 다변량 정규성을 제시하고, 동일한 방법을 무작위 재귀 트리와 리다이렉션 기반 모델에도 적용하였다.
상세 분석
이 연구는 기존의 무작위 그래프 이론에서 차수 분포만을 주요 특성으로 삼아 왔던 전통을 넘어, 정점이 가지고 있는 “잎수”(leaf‑degree)라는 새로운 로컬 정보를 도입한다. 정의된 공동 차수‑잎수 분포 (n_{k,\ell})는 정점의 차수 (k)와 그 이웃 중 잎인 정점의 개수 (\ell)를 동시에 기술한다. 논문은 먼저 성장 과정에서 발생하는 전이 관계를 이용해 ((k,\ell))에 대한 2‑인덱스 재귀식 (9)–(10)을 도출한다. 이 재귀식을 다변량 생성함수 (g(y,z)=\sum_{k>\ell\ge0}y^k z^\ell n_{k,\ell})에 적용하면, 편미분 방정식 (11)이 얻어지며, 이는 적분 형태의 해 (12)로 명시된다.
생성함수 해를 (y=1) 혹은 (z=1)에 대입함으로써 각각 잎수 분포 (m(z)=g(1,z))와 차수 분포 (n(y)=g(y,1))를 복원한다. 특히 (m(z))를 전개하면 식 (13)으로 나타나는 복잡한 적분식이 나오며, 큰 (\ell)에 대해 (m_\ell\sim \ell^{-3})이라는 파워‑로우 꼬리를 보인다. 이는 PA 트리의 차수 분포가 (\sim k^{-3})와 동일한 지수이지만, 상수 계수가 다름을 의미한다.
보호된 정점(leaf‑degree 0인 비잎)의 전체 비율은 (p=m_0-n_1) 로 정의되며, 식 (14)에서 정확히 (p=0.039447\ldots) 로 계산된다. 차수별 보호 비율 (n_{k,0}= \frac{1}{2k}\bigl(k^2-\frac14\bigr)k^{-1}) (식 15) 역시 폐쇄형으로 얻어진다. 이는 차수가 커질수록 보호 정점이 급격히 감소함을 보여준다.
또한, 정점의 차수와 잎수 사이의 상관관계 (\langle k\ell\rangle)와 차수별 평균 잎수 (\bar\ell(k))를 (g(y,z))의 혼합 편미분으로 구한다. 고차 정점(허브)의 경우 (\ell)가 평균적으로 (k/2)에 몰려들며, 표준편차는 (\sim\sqrt{k}) 수준으로 감소한다는 결과는 식 (19)과 수치 실험에서 확인된다.
확률적 변동에 대해서는 (N_{k,\ell})가 선형적으로 (N)에 비례하고, 중심극한정리에 따라 다변량 정규분포로 수렴한다는 근거를 제시한다. 구체적으로 (N_1) (잎의 수)와 (N_2) (차수 2 정점)의 평균·분산·공분산을 계산해 식 (20)–(22)와 같은 가우시안 근사식을 얻었다. 이러한 결과는 기존 연구에서 차수 카운트만을 다루던 것보다 훨씬 풍부한 통계적 정보를 제공한다.
마지막으로, 동일한 프레임워크를 무작위 재귀 트리(RRT)와 “리다이렉션 기반” 모델에 적용해 각각의 공동 분포와 잎수 분포를 유도한다. RRT에서는 기존에 알려진 (n_k=2^{-k})와 (m_\ell)를 재현하고, 리다이렉션 모델에서는 식 (27)‑(28)과 같이 잎수에 기반한 선호 부착 규칙을 분석한다.
전반적으로 이 논문은 “차수‑잎수”라는 두 차원의 로컬 구조를 동시에 고려함으로써, 기존 PA 트리 분석의 한계를 뛰어넘는 새로운 정량적 도구와 결과를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기