생태계 네트워크 중첩성 측정을 위한 새로운 거리 기반 지표
초록
본 논문은 이분 그래프 형태의 생태계 상호작용 행렬을 ‘포장(pack)’한 뒤, 행렬 내 1(연결) 위치들의 맨해튼 거리를 이용해 중첩성을 정량화하는 새로운 지표 η를 제안한다. η는 완전 중첩 행렬과 무작위 행렬 사이의 거리 비율로 정의되며, 0과 1 사이 값을 가진다. 23개의 실제 곤충‑식물 상호작용 네트워크에 적용해 기존의 Nestedness Temperature(T)와 비교했을 때, η가 행렬의 점유율(occupancy)과 강한 상관관계를 보이며 보다 직관적인 해석을 제공함을 확인하였다.
상세 분석
이 연구는 기존의 Nestedness Temperature(NT) 지표가 행렬 크기와 점유율에 민감하게 반응한다는 한계를 인식하고, 보다 보편적인 척도를 만들기 위해 ‘거리 기반’ 접근을 채택하였다. 먼저, L₁×L₂ 크기의 이분 행렬 M을 행과 열의 연결도( degree )에 따라 내림차순으로 재배열(pack)한다. 이 과정은 행렬 내 1의 분포를 (1,1) 코너에 가깝게 몰아넣어 시각적 중첩성을 극대화한다. 이후 각 셀(i,j)을 단위 정사각형에 투사하여 좌표 xᵢ=(i‑1)/L₁+1/(2L₁), yⱼ=(j‑1)/L₂+1/(2L₂) 로 변환하고, 맨해튼 거리 dᵢⱼ=xᵢ+yⱼ를 계산한다. 전체 거리 d는 모든 1에 대한 거리의 합이다.
두 개의 기준 행렬을 정의한다. (1) 완전 중첩 행렬 ˜M은 1을 (1,1) 코너부터 대각선 순으로 채워 ‘최소 거리’를 갖는다. 이때의 총 거리 d_min은 이론적으로 가장 작은 값이다. (2) 무작위 행렬 M_r은 동일한 점유율 ρ를 갖는 독립적인 베르누이 시도이며, 평균 거리 d_rand는 N·μ (μ=1) 로 간단히 구한다. 여기서 N은 1의 총 개수이다.
새로운 중첩성 지표 η는 다음과 같이 정의된다.
η = (d – d_min) / (d_rand – d_min)
이 식은 d가 d_min에 가까울수록 η가 0에, d가 d_rand에 가까울수록 η가 1에 접근하도록 설계되었다. 즉, η=0은 완전 중첩, η=1은 완전 무작위를 의미한다.
실제 데이터에 적용하기 위해 23개의 곤충‑식물 상호작용 네트워크를 수집하였다. 각 네트워크에 대해 L₁, L₂, ρ, η, 그리고 기존 NT 값을 계산하였다. 결과는 η가 0.170.83 사이에 분포했으며 평균 0.45를 보였다. 반면 NT는 6.843 사이로 범위가 넓고 η와는 거의 상관관계가 없었다(R=0.19, p=0.18). 특히, 시각적으로 중첩성이 높은 네트워크는 η가 낮게, 중첩성이 낮은 네트워크는 η가 높게 나타났다. 또한 η와 ρ 사이에 양의 상관관계가 존재함을 확인했으며, 이는 점유율이 높을수록 포장 후 행렬이 더 조밀하게 중첩된다는 직관과 일치한다.
이 방법의 장점은 (i) 순수 기하학적 개념에 기반해 구현이 간단하고, (ii) 두 명확한 벤치마크(완전 중첩, 무작위)를 사용해 절대적인 척도를 제공한다는 점이다. 또한, 매개변수가 없으며 0~1 사이의 직관적인 값으로 해석이 용이하다. 다만, 현재 구현은 이분 행렬에 국한되며, 점유율에 대한 의존성이 완전히 제거되지 않았다는 점은 향후 연구 과제로 남는다.
댓글 및 학술 토론
Loading comments...
의견 남기기