학술지 인용 관계를 통한 저널 분류 가능성
초록
본 논문은 과학인용색인에 수록된 학술지들의 집계 인용 행렬을 이용해 주성분분석(PCA)과 요인분석을 적용함으로써 저널을 인용 차원에서 위치시키는 방법을 제시한다. 회전되지 않은 요인점수는 정확하지만 해석이 어려우며, 회전된 해는 모델 가정에 따라 달라진다. 이러한 방법론을 생화학 분야 저널 집합에 적용해 기존 분류와의 일치도를 검증한다.
상세 분석
이 연구는 과학인용색인(Science Citation Index)에서 제공하는 거대한 인용 매트릭스를 ‘인용된 저널’과 ‘인용하는 저널’ 사이의 이중 관계로 해석한다. 매트릭스의 행은 피인용 저널, 열은 인용 저널을 나타내며, 각 셀은 특정 저널이 다른 저널에 몇 번 인용했는지를 기록한다. 이러한 고차원 데이터를 차원 축소 기법인 주성분분석(PCA)과 요인분석에 투입함으로써, 저널들을 몇 개의 잠재적 인용 차원(구성요소)으로 요약한다.
주성분은 서로 직교하고, 추출 순서에 따라 단계적으로 제거할 수 있어 ‘단계적 추출(stepwise extraction)’이 가능하다. 이때 얻어지는 ‘비회전된 요인점수(unrotated factor scores)’는 원 데이터에 대한 정확한 선형 변환이므로, 수치적으로는 손실이 없으며, 각 저널이 특정 주성분에 얼마나 기여하는지를 객관적으로 보여준다. 그러나 비회전된 점수는 해석이 직관적이지 않아, 실제 학문 분야와의 대응을 찾기 어렵다.
이를 보완하기 위해 ‘회전(rotated)’을 수행한다. Varimax와 같은 직교 회전이나 Oblimin과 같은 사각 회전을 적용하면 요인 구조가 더 명확해져, 각 요인이 특정 학문 영역이나 연구 주제와 매핑되기 쉬워진다. 하지만 회전 과정은 ‘모델 가정(model assumption)’을 전제로 한다. 즉, 연구자는 몇 개의 요인을 선택하고, 어떤 회전 방법이 적합한지를 판단해야 하며, 이러한 선택은 결과에 민감하게 작용한다. 따라서 회전된 요인점수는 해석 가능성을 높이지만, ‘주관적 가정’에 의해 좌우되는 부분이 존재한다.
논문은 이러한 방법론적 차이를 명확히 구분하고, 특히 ‘분류의 모호성(ambiguity)’을 강조한다. 회전된 결과가 기존 분류 체계와 일치하더라도, 이는 선택된 모델에 의한 ‘사후 검증(post‑hoc validation)’에 불과할 수 있다. 따라서 저자는 회전된 요인구조를 ‘가설 검증 도구’로 활용하고, 실제 데이터가 내포한 구조와 비교함으로써 기존 분류의 타당성을 시험한다.
실증 분석에서는 생화학 분야 저널 집합을 대상으로, 비회전 및 회전된 요인점수를 계산하고, 이를 기존의 ‘생화학 저널’ 정의와 교차 검증한다. 결과는 비회전 점수만으로는 명확한 구분이 어려우나, 회전된 요인구조는 생화학 저널을 하나의 요인에 집중시키는 경향을 보이며, 기존 분류와 높은 일치도를 나타낸다. 이는 회전된 요인분석이 실제 학문적 경계를 탐색하는 데 유용함을 시사한다.
전체적으로 이 논문은 대규모 인용 데이터베이스를 정량적 구조 분석에 적용하는 방법론적 프레임워크를 제시하고, 회전 여부에 따른 해석적 차이와 모델 가정의 영향을 심도 있게 논의한다. 특히, 저자는 ‘분류는 절대적이 아니라 데이터와 모델에 의존한다’는 점을 강조하며, 향후 학술지 분류 작업에 있어 통계적 검증과 이론적 근거를 동시에 고려할 필요성을 제언한다.
댓글 및 학술 토론
Loading comments...
의견 남기기