맥콜스 영역 변환과 I3 지표의 비교 분석

맥콜스 영역 변환과 I3 지표의 비교 분석

초록

본 연구는 수학·심리학 분야 11개 저널에 대해 맥콜스 영역 변환과 통합 영향 지표(I3), 그리고 PR6 백분위 계층을 적용해 두 방법의 통계적 특성과 실용성을 비교하였다. 결과는 두 접근법이 상관관계가 높지만, I3가 연속 백분위 기반으로 더 세밀한 차별력을 제공함을 보여준다.

상세 분석

맥콜스(1922)의 영역 변환은 왜도(skewness)가 큰 인용 분포를 정규분포 형태로 변환함으로써 전통적인 평균·표준편차 기반 통계 분석을 가능하게 한다(Krus & Kennedy, 1977). 변환 과정은 각 논문의 인용수를 누적분포함수(CDF)값으로 바꾸고, 이를 정규분포의 역함수에 입력해 Z점수(z‑score)를 산출한다. 이렇게 얻은 Z값은 정규성 가정 하에 t‑검정, ANOVA 등 다양한 비교 분석에 활용될 수 있다. 그러나 변환은 원시 데이터의 순위 정보를 손실시키며, 특히 극단값(예: 매우 높은 인용)을 압축시켜 실제 영향력을 과소평가할 위험이 있다.

반면 Leydesdorff와 Bornmann이 제안한 통합 영향 지표(I3)는 인용 분포 자체를 백분위(quantile)로 전환한 뒤, 각 백분위 구간에 가중치를 부여해 종합 점수를 계산한다. I3는 연속 백분위(0–100) 전체를 사용하므로 모든 인용 수준을 세밀하게 반영한다. 또한 PR6 변형은 상위 1 %·95‑99 %·90‑95 %·75‑90 %·50‑75 %·하위 50 %의 여섯 개 계층으로 구분해 가중치를 차등 적용함으로써 고인용 논문의 기여도를 강조한다. 이러한 계층화는 연구자·기관·저널 간 비교 시 ‘핵심 논문’의 비중을 명확히 드러내는 장점이 있다.

본 논문은 Mutz & Daniel(2012)의 실증 설계를 그대로 차용해 ‘수학·심리학’ 분야 11개 저널을 대상으로 세 가지 지표를 동시에 계산하였다. 먼저 각 저널의 논문 집합에 대해 인용 횟수를 수집하고, 맥콜스 변환을 적용해 Z값 평균과 표준편차를 도출했다. 이어서 I3는 연속 백분위 기반으로 각 논문의 백분위 순위를 구하고, 사전 정의된 가중치(예: 상위 1 %에 6점, 95‑99 %에 5점 등)를 곱해 합산하였다. PR6는 동일 가중치를 여섯 개 계층에 할당해 점수를 산출했다.

통계적으로는 세 지표 간 Pearson 상관계수가 0.86 이상으로 높게 나타났으며, 특히 I3와 PR6는 거의 일치하는 패턴을 보였다. 그러나 맥콜스 Z값은 일부 저널에서 과도하게 낮은 값(음수)을 기록했는데, 이는 변환 과정에서 극단 인용이 정규화되면서 정보 손실이 발생했기 때문이다. 반면 I3와 PR6는 고인용 논문의 비중이 큰 저널을 명확히 구분했으며, 순위 차이가 미세하게 조정되었다.

결과적으로 두 접근법은 ‘정규성 가정’과 ‘백분위 기반’이라는 근본적인 차이를 가지고 있다. 맥콜스 변환은 전통적인 통계 검정에 친숙하지만, 인용 분포의 비대칭성을 완전히 보정하지 못한다. I3와 PR6는 데이터의 원시 형태를 유지하면서도 가중치를 통해 영향력을 정량화하므로, 정책 결정·연구 평가 등에 보다 직관적이고 신뢰성 있는 지표로 활용될 가능성이 크다.