페이스북 대학 네트워크의 사회구조와 특성 분석
초록
본 연구는 2005년 9월 한 시점에 수집된 미국 100개 대학의 페이스북 친구망을 대상으로, 성별·학년·전공·고등학교·거주지 등 사용자 속성의 동질성(assortativity)과 회귀·ERGM 모델을 이용한 dyad 수준 영향, 그리고 알고리즘 기반 커뮤니티 탐지를 통한 거시적 그룹 구조를 종합적으로 분석한다. 결과는 고등학교 출신이 큰 규모 대학에서, 전공이 소규모 대학에서 사회적 조직에 더 큰 역할을 함을 보여준다.
상세 분석
이 논문은 두 가지 분석 축을 중심으로 페이스북 친구망의 미시·거시 구조를 정량화한다. 첫 번째 축은 dyad 수준의 동질성 측정이다. Newman의 범주형 assortativity 계수를 이용해 성별, 학년, 전공, 고등학교, 거주지 각각에 대한 r값을 계산했으며, 대부분의 대학에서 학년과 성별이 가장 높은 양의 동질성을 보였다. 특히 대규모 대학에서는 고등학교 동문 간 연결이 눈에 띄게 강화되어, r값이 0.1~0.2 수준으로 나타났다. 이는 같은 고등학교 출신 학생들이 물리적 거리와 무관하게 온라인에서도 지속적인 사회적 유대를 유지한다는 가설을 뒷받침한다.
두 번째 축은 통계적 모델링이다. 저자들은 독립 dyad 가정을 전제로 로지스틱 회귀분석을 수행했으며, 각 속성의 nodematch 변수를 포함해 “같은 속성을 가질 경우 친구가 될 로그오즈가 얼마나 증가하는가”를 추정했다. 결과는 학년이 가장 큰 로그오즈 증가(β≈1.2)를 보였고, 전공과 고등학교는 대학 규모에 따라 β값이 크게 변동했다. 이어서 exponential random graph model(ERGM)을 적용해 edges, nodematch(4속성) 및 triangle term을 포함시켰다. triangle coefficient가 양수인 경우가 대부분이며, 이는 네트워크가 단순히 속성 기반 동질성뿐 아니라 삼각형 폐쇄 현상, 즉 전형적인 사회적 전이(transitivity)를 보인다는 것을 의미한다. 다만, ERGM의 수렴 문제로 16개 소규모 대학에만 적용 가능했으며, 대규모 네트워크에서는 계산 복잡도와 메모리 제한이 걸림돌이 됨을 지적한다.
거시적 분석에서는 다양한 커뮤니티 탐지 알고리즘(예: modularity 최적화, 스펙트럴 분할, hierarchical clustering)을 적용해 네트워크를 군집화하고, 이를 사전 정의된 속성 기반 파티션과 정량적으로 비교했다. 비교 지표로는 normalized mutual information(NMI)와 adjusted Rand index(ARI)를 사용했으며, 학년 파티션과 가장 높은 일치도를 보였다. 반면 전공 파티션은 대학마다 일관성이 떨어졌으며, 특히 대규모 대학에서는 전공 기반 커뮤니티가 거의 형성되지 않았다. 성별 파티션은 전체 네트워크보다는 여성·남성 전용 서브네트워크에서 더 명확히 드러났으며, 이는 성별 동질성이 전체 네트워크보다는 성별별 서브그룹에서 더 강하게 작용함을 시사한다.
결과 종합에서 저자들은 “미시적 동질성(assortativity, 로지스틱 회귀·ERGM)과 거시적 군집 구조(커뮤니티 탐지)는 상호 보완적인 관점을 제공한다”는 결론을 내렸다. 특히 고등학교 동문 관계가 대규모 대학에서 사회적 조직을 주도하고, 전공 동질성은 소규모 대학에서만 의미 있는 커뮤니티 형성에 기여한다는 점은 정책적·교육적 함의를 가진다. 예를 들어, 대학교 신입생 오리엔테이션 프로그램에서 고등학교 동문 네트워크를 활용하면 초기 사회통합을 촉진할 수 있고, 소규모 대학에서는 전공 기반 소그룹 활동을 강화함으로써 네트워크 결속을 높일 수 있다.
또한, 데이터 수집 시점이 2005년이라는 점, .edu 이메일 기반 가입 제한, 그리고 사용자 자발적 프로필 입력에 의한 누락(missing) 데이터가 존재한다는 한계도 명시한다. 이러한 제약에도 불구하고, 100개 대학이라는 대규모 표본과 다양한 분석 기법을 결합한 본 연구는 온라인 SNS가 오프라인 사회구조를 어느 정도 반영한다는 가설을 실증적으로 뒷받침한다. 향후 연구에서는 시간에 따른 네트워크 진화, 교차 대학 간 연결, 그리고 추가적인 인구통계(인종·경제적 배경) 변수를 포함해 다층 네트워크 모델링을 시도할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기