펫 SNS의 이중 프로필 분석: Catster·Dogster·Hamsterster 사례 연구
초록
본 논문은 고양이·개·햄스터 전용 SNS인 Catster, Dogster, Hamsterster에서 한 사용자가 여러 애완동물 프로필을 운영하는 ‘다중 프로필’ 구조를 분석한다. 프로필 수준 네트워크와 계정(가구) 수준 네트워크를 각각 정의하고, 두 수준 간의 구조적 차이, 동질성(동성·연령·지역) 특성, 스펙트럼 대각성 검정을 수행한다. 또한 친구 관계만을 이용해 두 프로필이 동일 사용자가 만든 것인지를 예측하는 알고리즘을 제시해 높은 정확도를 달성한다.
상세 분석
이 연구는 기존 온라인 SNS가 단일 사용자당 하나의 프로필만을 허용한다는 전제와 달리, 펫 SNS에서는 사용자가 소유한 각 애완동물마다 별도의 프로필을 만들 수 있다는 특수성을 활용한다. 이를 ‘다중 프로필 소셜 네트워크’라는 새로운 모델로 정의하고, 프로필 집합 V, 계정 집합 W, 친구 관계 E, 그리고 매핑 m:V→W 로 수학적 프레임워크를 구축한다. 프로필 수준 그래프 Gp=(V,E)와 계정 수준 그래프 Ga=(W,m(E))를 각각 분석함으로써 두 네트워크가 갖는 구조적 차이를 정량화한다.
데이터는 Catster(204 424 프로필), Dogster(451 710 프로필), Hamsterster(2 950 프로필)로 구성되며, 가구당 평균 애완동물 수는 1.92.0 수준이다. 프로필 수준에서는 평균 차수가 53.3(고양이)·37.8(개)로 매우 높으며, 계정 수준에서는 차수가 크게 감소한다(9.4·16.5·5.1). 이는 동일 가구 내 프로필이 서로 연결될 가능성이 낮아, 계정 수준 네트워크가 더 ‘규칙적’이고 균등한 차수 분포를 보임을 의미한다. 파워‑러 법칙 피팅 결과, 프로필 수준의 차수 분포는 γ≈2.12.5 범위로 전형적인 스케일프리 특성을 유지하지만, 계정 수준에서는 γ가 더 크게 나타나 차수 불평등이 감소한다.
동질성 분석에서는 성별, 연령, 지역 등 메타데이터에 대한 동질성 지수를 제시한다. 프로필 수준보다 계정 수준에서 동질성 지수가 현저히 높아, 같은 가구에 속한 프로필들은 연령·지역·성별이 유사한 경향이 강함을 확인한다. 특히 연령 동질성은 ‘친구 관계가 가구 내에서 형성될 가능성’과 높은 상관관계를 보인다.
스펙트럴 대각성 검정은 기존 연구의 ‘친구와 가족 관계의 정합성’ 측정을 확장한다. 고유값 분해를 통해 두 인접 행렬(친구와 가족)의 정렬 정도를 정량화했으며, 결과는 두 네트워크가 상당히 독립적이지만, 일부 고유벡터에서 상관성이 존재함을 보여준다. 이는 친구 관계가 가구 구조를 완전히 대체하지 않으며, 별도의 사회적 연결망을 형성한다는 점을 시사한다.
가장 혁신적인 부분은 동일 사용자가 만든 두 프로필을 예측하는 알고리즘이다. 노드 특성(공통 친구 수, 프로필 메타데이터 차이, 계정 간 거리 등)을 피처로 사용하고, 로지스틱 회귀와 랜덤 포레스트를 결합한 모델을 구축했다. 교차 검증 결과, 정밀도와 재현율 모두 0.95 이상으로, 단순 친구 관계만으로도 높은 예측 성능을 달성한다. 이는 다중 프로필 네트워크에서 ‘계정 식별’ 문제가 실제 서비스 운영이나 사기 탐지에 활용될 수 있음을 의미한다.
전체적으로 이 논문은 다중 프로필 구조가 네트워크 토폴로지, 동질성, 스펙트럼 특성에 미치는 영향을 체계적으로 분석하고, 실용적인 계정 매칭 방법을 제시함으로써 SNS 연구와 보안 분야에 새로운 연구 방향을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기