X에서 다차원 정치 지형 매핑 사용자 정치인 언론의 의견 추정 데이터셋

X에서 다차원 정치 지형 매핑 사용자 정치인 언론의 의견 추정 데이터셋
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

**
본 논문은 프랑스 정치 영역의 X(구 트위터) 사용자, 국회의원, 언론 매체를 대상으로 16개의 이념·이슈 차원을 포함한 다차원 정치 위치를 추정하고, 활동·인기 지표와 함께 공개 데이터셋으로 제공한다. 팔로우 네트워크 기반의 이데올로기 스케일링과 CHES 설문을 이용한 정규 변환을 결합해 연속형 점수를 얻으며, 프로필 바이오와 언론 분류를 통해 검증한다.

**

상세 분석

**
이 연구는 기존 미국 중심의 좌우·자유보수 1차원 스케일링을 넘어, 이민, EU, 자유주의 가치, 엘리트·제도에 대한 태도, 민족주의, 환경 등 16개의 세분화된 차원을 동시에 다루는 것이 가장 큰 특징이다. 데이터 수집은 2023년 2월에 프랑스 국회의원 886명(실제 분석에 포함된 883명)과 그들의 팔로워를 전수 조사한 뒤, 최소 3명의 의원을 팔로우하고 25명 이상의 팔로워를 가진 978 206명의 일반 사용자를 선정함으로써 정치적 인식 수준이 높은 ‘지식 사용자’를 확보했다.

팔로우 관계만을 이용한 이데올로기 스케일링은 Barbera(2015)의 확률적 동질성 모델을 기반으로 하며, MCMC 대신 Correspondence Analysis(CA)를 활용해 효율적으로 잠재 위치 ϕ를 추정한다. 잠재 공간의 차원 수는 파티 수(11개)와 CHES 설문 차원 수에 맞추어 10~8 차원으로 제한했으며, Ridge 회귀(α=1.0)로 얻은 affine 변환을 통해 잠재 위치를 실제 설문 차원(좌우, GAL‑TAN, EU, 반엘리트 등)으로 매핑한다. 이 과정에서 파티 평균 위치를 기준으로 변환 파라미터를 학습함으로써, 잠재 공간의 회전·이동 자유도를 제거하고 실질적인 이념·이슈 좌표를 확보한다.

검증 단계에서는 (1) 사용자 프로필 바이오를 인간·AI 라벨러가 정치 스탠스로 코딩한 결과와 높은 상관관계를 보였고, (2) 400여 개 프랑스 웹 도메인의 추정 위치가 기존 연구가 제시한 좌우 분류와 일치했다. 또한, 활동 지표(일일 평균 포스트 수, 팔로워·팔로잉 수)와 정치 위치 간의 관계를 탐색할 수 있는 베이스라인 모델을 제공한다.

데이터셋은 978 000명 규모의 사용자·883명 국회의원·400여 개 언론 도메인의 다차원 점수와 메타데이터를 포함한다. 공개 형식은 CSV와 JSON이며, 코드와 재현 파이프라인도 GitHub에 공개돼 재현 가능성을 높였다. 한계점으로는 팔로우 기반 추정이 실제 발언·행동과 차이 있을 수 있고, 프랑스 특수 정치 구조에 최적화돼 다른 국가에 바로 적용하기 어려울 수 있다는 점을 언급한다.

**


댓글 및 학술 토론

Loading comments...

의견 남기기