넷센스 데이터에서 링크 형성·지속·소멸 분석
초록
본 연구는 노틀담대 신입생을 대상으로 설문과 스마트폰 로그를 결합한 행동 네트워크를 구축하고, 의견 일치가 링크 형성·유지와 어떤 관계가 있는지를 통계·머신러닝으로 분석한다.
상세 분석
이 논문은 2011년 가을에 입학한 노틀담대 신입생을 대상으로 3년간 6차례에 걸친 설문 조사와 스마트폰 통화·문자 로그를 수집한 독특한 데이터셋을 활용한다. 설문을 통해 얻은 정치·사회·캠퍼스 활동에 대한 의견을 23개의 특성(예: 정치 성향, 종교, 동아리 참여 등)으로 정량화하고, 스마트폰 로그를 기반으로 두 종류의 네트워크를 만든다. 첫 번째는 통화·문자 교류 빈도로 정의된 ‘통신 활동 네트워크’, 두 번째는 설문에서 직접 보고된 ‘우정 네트워크’이다. 두 네트워크 모두 설문에 응답한 학생들만을 포함해 동일한 정점 집합을 갖는다.
연구자는 링크의 세 가지 상태—형성, 지속, 소멸—를 각각 ‘새로운 연결이 생긴 경우’, ‘연결이 유지된 경우’, ‘연결이 사라진 경우’로 정의하고, 각 상태와 학생 특성 간의 상관관계를 탐색한다. 이를 위해 먼저 각 특성에 대해 두 학생 사이의 ‘동의 점수’를 계산한다. 동의 점수는 특성별로 양측이 동일한 응답을 했을 때 1, 다르면 0으로 매긴 뒤, 전체 특성에 대해 평균을 취해 0~1 사이의 값으로 만든다. 그런 다음 로지스틱 회귀와 랜덤 포레스트 등 여러 지도 학습 모델을 적용해 동의 점수가 링크 상태를 예측하는 데 얼마나 기여하는지 평가한다. 모델 성능은 정확도, 정밀도, 재현율, AUC 등 다양한 지표로 측정한다.
주요 결과는 다음과 같다. 첫째, 동의 점수가 높을수록 새로운 링크가 형성될 확률이 유의하게 증가한다. 특히 ‘정치적 견해’와 ‘캠퍼스 활동 참여도’에서 높은 동의가 강한 양의 회귀 계수를 보였다. 둘째, 기존 링크가 지속되는 경우에도 높은 동의 점수가 유지에 긍정적인 영향을 미쳤으며, 특히 ‘종교적 신념’과 ‘학업 목표’가 일치하는 경우 지속 확률이 크게 상승했다. 셋째, 반대로 동의 점수가 낮은 쌍은 링크 소멸 확률이 높았다. 특히 ‘사회적 이슈에 대한 의견 차이’와 ‘동아리 활동 참여 여부 차이’가 소멸을 강하게 예측했다. 머신러닝 모델 중 랜덤 포레스트가 가장 높은 AUC(0.84)를 기록했으며, 특성 중요도 분석을 통해 ‘정치·사회 이슈 동의’, ‘동아리·학과 활동 동의’, ‘학업 목표 동의’가 핵심 변수임을 확인했다.
이러한 결과는 사회적 연결이 단순히 빈번한 접촉만이 아니라, 의견·가치관의 일치에 크게 의존한다는 기존 이론을 실증적으로 뒷받침한다. 또한, 설문 기반 특성 데이터와 디지털 행동 로그를 결합함으로써 링크 예측 정확도를 향상시킬 수 있음을 보여준다. 연구는 향후 대학 생활 초기 단계에서 학생들의 사회적 통합을 지원하기 위한 개입 설계, 혹은 온라인 플랫폼에서의 친화성 기반 추천 시스템 개발 등에 활용될 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기