사회 만족도 예측: 위보 데이터와 경제 지표의 통합 분석
초록
본 연구는 광동성 거주자 2,018명의 위보 활동 데이터를 활용해 사회·경제 만족도를 추정한다. 행동·언어 특성을 추출하고 회귀 모델을 적용해 만족도를 예측한 뒤, 2012년 지역 경제 지표와의 상관관계를 분석하였다. 결과는 특정 소셜미디어 특성이 경제 만족도를 의미 있게 설명하며, 예측된 만족도와 실제 경제 지표 간에 유의한 양의 상관관계가 있음을 보여준다.
상세 분석
이 논문은 전통적인 설문조사의 비용·시간 제약을 극복하고, 실시간·대규모 사회 만족도 측정을 위한 데이터 기반 접근법을 제시한다. 먼저, 광동성 각 도시 인구 비율에 맞춰 2,018명의 광동어 사용 위보 이용자를 모집했으며, 이들의 공개 포스트, 전송 시간, 팔로워·팔로잉 수 등 행동적 메트릭과 텍스트 마이닝을 통한 언어적 특성을 동시에 추출하였다. 행동 특성에는 포스팅 빈도, 감정 표현 비율, 상호작용 강도 등이 포함되고, 언어 특성은 감성 사전 기반 긍정·부정 단어 비중, 주제 모델링을 통한 토픽 분포, 그리고 사회·경제 관련 키워드 사용 빈도로 구분된다.
특징 선택 단계에서는 상관분석과 LASSO 회귀를 이용해 다중공선성을 최소화하고, 예측 성능에 기여도가 높은 변수를 선별하였다. 이후 선형 회귀, 라쏘, 릿지 등 여러 회귀 모델을 교차 검증으로 비교했으며, 최종 모델은 평균 제곱오차(MSE)와 결정계수(R²) 기준으로 가장 높은 예측력을 보인 라쏘 회귀를 채택하였다. 모델 학습에 사용된 종속 변수는 사전 설계된 설문을 통해 얻은 ‘경제 만족도’ 점수이며, 이는 5점 척도로 정규화되었다.
예측 결과를 검증하기 위해 2012년 광동성의 지역 생산총액(GDP), 고용률, 소비자 물가 지수(CPI) 등 7개의 경제 지표와 예측된 만족도 점수를 Pearson 상관분석하였다. 그 중 GDP와 고용률은 0.62, 0.55의 유의한 양의 상관관계를 보였으며, 이는 소셜미디어 상의 행동·언어 패턴이 실제 지역 경제 상황을 반영한다는 가설을 뒷받침한다. 반면, 물가 변동과는 약한 음의 상관관계(‑0.21)만 나타나, 만족도와 물가 인식 사이의 복합적 관계를 시사한다.
연구의 강점은 대규모 실시간 데이터와 전통적 경제 지표를 연결함으로써, 정책 입안자가 사회 정서를 빠르게 파악하고 조기에 대응할 수 있는 근거를 제공한다는 점이다. 그러나 샘플이 위보 활성 사용자에 국한돼 일반 인구 전체를 대표하기 어려우며, 언어 특성 추출에 사용된 사전이 광동어 방언을 충분히 포괄하지 못한다는 한계가 있다. 또한, 회귀 모델이 비선형 관계를 충분히 포착하지 못할 가능성이 있어, 향후 딥러닝 기반 시계열 모델이나 그래프 신경망을 적용한 연구가 필요하다.
요약하면, 이 논문은 소셜미디어 행동·언어 데이터를 정량화하여 지역 경제 만족도를 예측하고, 실제 경제 지표와의 상관성을 입증함으로써 디지털 사회 측정 분야에 실용적인 방법론을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기