스펙트럼 클러스터링으로 본 성격 구조의 새로운 시각
초록
본 연구는 20,993명의 응답자를 대상으로 300문항 IPIP‑NEO 데이터를 스펙트럼 클러스터링으로 분석하고, 전통적 요인분석과 비교하였다. 5‑클러스터는 기존 5요인 모델과 거의 일치했으며, 6‑클러스터는 정직‑겸손(Honesty‑Humility) 요인을 포함한 HEXACO 모델과 유사한 구조를 드러냈다.
상세 분석
이 논문은 성격 설문 데이터에 대한 대안적 통계 방법으로 스펙트럼 클러스터링을 도입한 점이 가장 큰 특징이다. 먼저 300개 문항 간의 피어슨 상관행렬을 거리 행렬로 변환하고, 가우시안 커널 σ 값을 적용해 가중 인접 행렬 A 를 만든다. 여기서 σ 는 연결 강도의 스케일을 조절하는 핵심 파라미터이며, 값이 작을수록 먼 문항 간 가중치가 거의 0에 가깝고, 크면 거의 1에 수렴한다. 이후 대칭 라플라시안 L = I – D⁻¹ᐟ² A D⁻¹ᐟ² 을 계산하고, 그 고유값·고유벡터를 분석한다. 고유값이 0에 가까울수록 네트워크의 연결성(또는 클러스터 구조)을 잘 설명하므로, “스펙트럼 스크리” 방식을 이용해 유의미한 고유벡터 개수 l 을 결정한다. 저자는 σ 값을 0.35~1 범위에서 탐색했으며, 이 구간에서 첫 네 개 고유값이 뚜렷하게 분리되는 것을 확인해 l = 4 로 설정하였다.
클러스터 수 k 는 “클러스터 일관성” 테스트로 선정한다. 무작위로 150문항을 추출해 동일한 l, σ 값으로 스펙트럼 클러스터링을 수행하고, 원래 클러스터와의 불일치 비율을 반복 측정한다. σ 가 0.4 이상일 때 k = 5 또는 6 에서 최소 오류가 나타났으며, 이는 5‑또는 6‑클러스터 해가 데이터에 내재된 구조임을 시사한다. 이후 k 를 2~40까지 확대해 재검증했지만, 5와 6이 여전히 최적값으로 남았다.
요인분석과의 비교에서는 5‑요인(Varimax 회전) 결과와 5‑클러스터 결과가 286/300문항에서 일치해 높은 재현성을 보였다. 반면 6‑요인 해는 실제 의미가 약한 작은 요인(7문항)만을 생성했지만, 6‑클러스터는 34문항으로 구성된 큰 클러스터를 형성했으며, 이는 주로 Agreeableness와 Conscientiousness의 하위 요인(특히 Morality, Modesty, Dutifulness)으로 구성돼 HEXACO 모델의 Honesty‑Humility와 높은 내용적 일치를 보였다. 또한, 감정성(Emotionality) 클러스터가 Openness‑O3와 겹치는 등, 기존 5요인 모델이 포착하지 못한 미세 구조를 드러냈다.
결과적으로 스펙트럼 클러스터링은 기존 요인분석이 놓칠 수 있는 비선형·비정규적 관계를 포착하고, 데이터 자체가 5‑또는 6‑차원 구조를 동시에 지니고 있음을 보여준다. 이는 성격 이론에서 HEXACO와 같은 대안 모델을 통계적으로 검증하는 새로운 길을 열어준다.
댓글 및 학술 토론
Loading comments...
의견 남기기