네트워크 과학 20년을 조명한 공동 저자 네트워크 분석
초록
본 연구는 Watts‑Strogatz, Barabási‑Albert, Girvan‑Newman 세 논문을 인용한 29,528편의 논문을 기반으로 52,406명의 네트워크 과학자를 추출하고, 이들의 공동 저자 네트워크를 구축·분석한다. 네트워크의 구조적 특성(연결성, 차수 분포, 클러스터링, 평균 경로 길이 등)과 시간·지역별 변화를 살펴보며, 중심성 상위 저자와 주요 연구 커뮤니티를 식별한다. 결과는 네트워크 과학이 물리·컴퓨터·생명·사회 과학 등으로 확산되었으며, 중국·미국이 연구 생산의 핵심 국가임을 보여준다.
상세 분석
이 논문은 네트워크 과학의 성장 과정을 정량적으로 조명하기 위해 ‘네트워크 과학 논문’이라는 정의를 도입한다. 구체적으로 1998‑2019년 사이에 Watts‑Strogatz(소규모 세계), Barabási‑Albert(스케일 프리), Girvan‑Newman(커뮤니티 탐지) 세 논문 중 하나라도 인용한 논문을 네트워크 과학 논문으로 간주하고, 해당 논문을 저술한 연구자를 ‘네트워크 과학자’로 정의한다. 이렇게 선정된 29,528편의 논문에서 52,406명의 저자를 추출해 무방향·비가중치 공동 저자 네트워크를 구축하였다.
네트워크 규모는 52,406개의 정점과 329,181개의 간선으로, 평균 차수는 12.56이지만 중앙값은 4에 불과해 고차원 노드가 소수 존재함을 시사한다. 차수 분포는 긴 꼬리를 보이며, 851개의 고립 정점(단일 저자 논문)도 존재한다. 네트워크의 연결성은 매우 높아, 가장 큰 연결 성분(LCC)은 32,904개의 정점으로 전체의 약 63%를 차지한다.
구조적 특성 측면에서 네트워크는 높은 동질성(assortativity = 0.57)과 극단적인 클러스터링(전역 = 0.98, 평균 지역 = 0.77)을 보인다. 평균 최단 경로 길이 6.8은 ‘작은 세계’ 현상을 확인시킨다. 이러한 특성은 과학 협업 네트워크 전반에 흔히 나타나는 현상과 일치하지만, 특히 네트워크 과학 분야가 다학제적 특성으로 인해 높은 집단 결속도를 유지한다는 점이 주목된다.
중심성 분석에서는 betweenness와 harmonic centrality를 사용했으며, 상위 10명은 J. Kurths, E. H. Stanley, G. Chen, A.-L. Barabási 등이다. 이들 중 Barabási는 인용 횟수 69,738회로 압도적인 영향력을 보이며, 네트워크 구조상에서도 핵심 연결 고리 역할을 한다. 중심성 지표와 인용 횟수 간의 강한 양의 상관관계는 학문적 영향력과 협업 네트워크 내 위치가 서로 강화되는 구조적 메커니즘을 시사한다.
시간적·지리적 분석에서는 2000년대 초반 물리학 중심의 연구가 컴퓨터 과학, 생물·뇌 과학 등으로 확산되는 흐름을 확인한다. 키워드 워드클라우드에서 초기에는 ‘scale‑free’, ‘small‑world’, ‘preferential attachment’ 등이 주를 이루었으나, 2010년 이후 ‘community detection’, ‘social network analysis’, ‘big data’, ‘machine learning’ 등이 부상한다. 국가별 논문 수를 보면 미국과 중국이 선두를 달리며, 특히 최근 5년간 중국의 성장률이 급격히 상승한다.
데이터 정제 과정에서 저자 이름의 변형과 동명자 문제를 사전 정의된 사전(dictionary)으로 해결했으며, 이는 기존 연구(Newman 등)의 방법론과 일치한다. 또한, 본 연구는 이전에 제한된 규모(1,589명)로 분석된 Newman의 작업을 30배 이상 확장함으로써, 네트워크 과학 공동체의 전반적 구조와 동태를 보다 정밀하게 파악한다.
전체적으로 이 논문은 네트워크 과학이 20년 동안 어떻게 학문적 경계를 허물고, 협업 네트워크를 통해 지식 전파와 혁신을 촉진했는지를 정량적·시각적으로 입증한다.
댓글 및 학술 토론
Loading comments...
의견 남기기