페이스북 친구 관계 그래프 분석

페이스북 친구 관계 그래프 분석
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 페이스북 사용자 약 55만 명과 84만 개의 친구 관계를 수집·정제한 뒤, 사회망 분석(SNA) 기법을 적용해 네트워크 구조와 핵심 지표(밀도, 직경, 중심성 등)를 측정하고, 시각화 도구를 활용해 주요 노드와 클러스터를 탐색한다.

상세 분석

본 연구는 페이스북의 공개 프로필을 자동으로 탐색하는 Java 기반 에이전트를 설계·구현하여, seed 사용자로부터 3단계 깊이까지 친구 리스트를 수집하였다. 수집 과정에서 페이지 구조의 DOM 트리를 활용한 자동 래퍼 적응 기법을 적용했으며, 수집된 데이터는 GraphML 형식으로 저장되었다. 초기 데이터는 중복 노드·중복 엣지가 존재했으나, Java HashSet을 이용한 O(n log n) 정제 알고리즘으로 중복을 완전 제거하고, 무방향 단순 그래프로 변환하였다. 최종 그래프는 547,302개의 정점과 836,468개의 유일한 엣지를 포함한다.

네트워크 특성 분석에서는 전통적인 SNA 지표를 활용하였다. 전체 그래프는 거의 연결된 상태이며(연결된 컴포넌트 2개, 최대 컴포넌트에 546,733 정점), 직경은 10, 평균 최단거리 5.00으로 작은 세계(small‑world) 특성을 보인다. 평균 차수는 3.06이며, 차수 분포는 긴 꼬리를 가진 스케일‑프리 형태를 시사한다. 클러스터링 계수 평균은 0.053으로 낮지만, 일부 고밀도 서브그래프가 존재한다. 중심성 측면에서는 베트윈니스가 높은 노드가 전체 네트워크의 흐름을 지배하며, 이러한 노드들은 잠재적 ‘허브’ 역할을 수행한다는 점을 시각화(FR‑Reingold, Harel‑Koren 등)로 확인하였다.

시각화 단계에서는 NodeXL, Prefuse, JUNG 등 기존 도구를 활용해 25,000노드 서브그래프와 베트윈니스 상위 50노드, 베트윈니스 값이 10 만 이상인 노드 군집 등을 별도 그래프로 그렸다. 그러나 대규모 그래프의 시각화는 연산 비용과 시각적 혼잡 문제로 제한적이며, 필터링·클러스터링을 통한 부분 그래프 선택이 필수적이다.

연구의 한계로는 데이터 수집이 공개 프로필에 한정돼 전체 페이스북 사용자 집단을 대표한다고 보기 어렵고, 시간에 따른 네트워크 진화 분석이 누락되었다는 점을 들 수 있다. 향후 작업에서는 더 효율적인 크롤링·병렬 처리 기법을 도입하고, 동적 네트워크 분석 및 커뮤니티 탐지를 통해 OSN과 현실 사회망 간의 구조적·동태적 유사성을 심층적으로 비교할 계획이다.


댓글 및 학술 토론

Loading comments...

의견 남기기