센티멘트 기반 상원의원 이념 순위 매기기
초록
본 논문은 그래프 라플라시안 기반 반지도 학습 기법을 활용해 미국 상원의원들의 투표 데이터를 이념 점수로 변환하고, 이를 통해 연속적인 이념 순위를 도출한다. 기존의 이분법적 분류와 달리 연속적인 스펙트럼을 제공함으로써 의원 간 미묘한 차이를 포착한다.
상세 분석
이 연구는 Agarwal가 제안한 그래프 라플라시안 기반 반지도 학습 방법을 이진 선택 데이터에 적용한다는 점에서 독창적이다. 먼저 각 상원의원의 투표 기록을 0‑1 벡터로 표현하고, 동일한 법안에 대한 투표 패턴이 유사한 의원들 간에 가중치를 부여한 인접 행렬을 구성한다. 라플라시안 행렬 L= D‑W (D는 차수 행렬, W는 가중치 행렬) 를 이용해 라플라시안 정규화 문제를 설정하고, 라벨이 지정된 소수의 의원(예: 극좌·극우 대표)에게 실제 이념 값을 부여한다. 이후 라플라시안 기반 에너지 함수를 최소화하는 방식으로 미라벨된 의원들의 연속적인 이념 점수를 추정한다. 핵심은 라플라시안이 그래프의 스무딩 효과를 제공해, 인접한 노드(즉, 투표 행태가 비슷한 의원) 간에 점수가 유사하도록 강제한다는 점이다.
수학적으로는 Lf = 0 형태의 고유값 문제를 풀어 최소 고유값에 대응하는 고유벡터를 구하고, 라벨 제약을 라그랑주 승수 형태로 포함한다. 이 과정에서 일반화된 고유값 문제로 변형되며, 효율적인 선형 시스템 솔버(예: Conjugate Gradient)를 이용해 대규모 데이터에도 적용 가능하도록 설계되었다.
실험에서는 111명의 상원의원에 대한 200여 개 법안의 투표 데이터를 사용했으며, 기존의 DW‑NOMINATE와 같은 차원 축소 기법과 비교했다. 결과는 라플라시안 기반 방법이 동일한 데이터에 대해 더 낮은 재구성 오차와 높은 순위 상관계수를 보였으며, 특히 중도파 의원들의 미세한 위치 변화를 더 정확히 포착했다는 점에서 의미가 크다. 또한 라벨 수가 적어도 안정적인 순위가 도출되는 점은 반지도 학습의 강점을 잘 보여준다.
한계점으로는 가중치 행렬을 정의할 때 투표 중요도(예: 주요 법안 vs. 부차적 법안)를 반영하지 않았으며, 라플라시안 파라미터(예: 스케일 파라미터) 선택이 결과에 민감하게 작용한다는 점을 들 수 있다. 향후 연구에서는 다중 라벨(예: 경제·사회·외교 등 여러 축)과 동적 그래프(시간에 따라 변하는 투표 패턴)를 통합하는 확장 모델이 제안될 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기