중심 영역·구간 지표로 보완하는 새로운 h‑지수
본 논문은 기존 h‑지수가 논문 수와 인용 수의 상관관계를 단순히 반영하면서 상위·하위 꼬리(heavy tails) 효과를 무시하는 한계를 보완하고자, ‘중심 영역 지표(A‑index)’와 ‘중심 구간 지표(I‑index)’라는 두 가지 새로운 지표를 제안한다. 저자는 각 지표를 논문의 인용 순서에 기반해 정의하고, 스페인·유럽의 저명한 연구자 15명을 대상으로 1999‑2009년 사이의 인용 데이터를 이용해 실증 분석을 수행한다. 결과는 제안…
저자: Pablo Dorta-Gonzalez, Maria Isabel Dorta-Gonzalez
본 논문은 연구자의 인용 분포를 보다 정밀하게 평가하기 위해 기존의 h‑지수가 가지고 있는 구조적 한계를 분석하고, 이를 보완하는 두 가지 새로운 지표, 즉 ‘중심 영역 지표(A₍j₎)’와 ‘중심 구간 지표(I₍j₎)’를 제안한다.
먼저, h‑지수는 “h개의 논문이 각각 최소 h번 인용”이라는 조건을 만족하는 가장 큰 정수 h를 정의함으로써, 논문의 수와 인용 수를 동시에 고려한다. 그러나 이 지표는 인용 분포의 상위 꼬리(극히 많이 인용된 논문)와 하위 꼬리(거의 인용되지 않은 논문)를 무시한다. 특히, 동일한 h‑값을 가진 두 연구자가 인용 곡선이 교차하는 경우, 한 연구자는 초기 논문에서 높은 인용을 받는 ‘선택적’ 특성을 보이고, 다른 연구자는 전체적으로 고르게 인용되는 ‘대량 생산형’ 특성을 보인다. h‑지수는 이러한 차이를 반영하지 못해 연구자 간 비교에 한계가 있다.
이를 해결하고자 저자는 인용 순서에 따라 정렬된 논문 집합을 기반으로 두 가지 ‘중심’ 지표를 정의한다.
1. **중심 영역 지표(A₍j₎)**
- 정의: 반경 j를 기준으로, h‑지수보다 위에 있는 j개의 논문과, h‑지수 이하이지만 h‑j번째 논문의 인용 수를 상한으로 하는 h+j개의 논문 전체 인용 수를 합산한다.
- 수식: A₍j₎ = Σ_{i=h−j}^{h+j} min(c_i, c_{h−j}) (단, i≠h)
- 의미: 상위 꼬리의 과도한 인용을 제한하면서도, 하위 꼬리에서 h‑지수 상승에 기여할 가능성이 높은 논문을 포함한다. 따라서 ‘선택적’ 연구자에게 더 큰 값을 부여한다.
2. **중심 구간 지표(I₍j₎)**
- 정의: h‑지수 중심을 기준으로 좌우 j개의 논문을 모두 포함해 인용 수를 합산한다.
- 수식: I₍j₎ = Σ_{i=h−j}^{h+j} c_i
- 의미: 구간 내 논문의 양을 강조하며, 상위 꼬리의 ‘높이’를 제한하지 않는다. 따라서 전체 인용량을 보다 포괄적으로 반영한다.
두 지표 모두 반경 j를 어떻게 설정하느냐에 따라 민감도가 달라진다. 저자는 경험적으로 h의 절반(⌊h/2⌋) 정도를 최적 반경으로 제시한다.
**실증 분석**
연구 대상은 스페인·유럽의 저명한 연구자 15명이며, 이들은 Price Medal 수상자이다. 데이터는 ISI Web of Science에서 1999, 2004, 2009년의 인용 횟수와 논문 수를 추출하였다. 분석 절차는 다음과 같다.
- 각 연도별 h‑지수와 함께 A₍j₎, I₍j₎를 j=1~10까지 계산하였다.
- 인용 곡선을 시각화하여 ‘선택적’(초기 논문 고인용)과 ‘대량 생산형’(전체 고르게 인용) 연구자를 구분하였다.
- h‑지수와 A₍j₎, I₍j₎ 사이의 상관관계를 Pearson 상관계수로 평가하고, 특히 j=7(≈h/2)에서 5년·10년 후 h‑값을 예측하는 능력을 검증하였다.
주요 결과는 다음과 같다.
- 동일한 h‑값을 가진 연구자들 사이에서 A₍j₎와 I₍j₎는 서로 다른 패턴을 보이며, 특히 A₍j₎는 ‘선택적’ 연구자에게 더 큰 값을 부여한다. 이는 상위 꼬리의 높은 인용을 제한적으로 반영하기 때문이다.
- j=7에서 A₍j₎와 I₍j₎는 5년 후 h‑값과의 상관계수가 0.78 이상으로, 기존 h‑지수만을 사용할 때보다 예측 정확도가 현저히 향상되었다.
- 그래프와 산점도를 통해 인용 곡선의 형태가 연구자의 ‘선택성’과 ‘생산성’를 시각적으로 구분할 수 있음을 확인하였다. 예를 들어, McCain과 Small은 동일한 h‑값을 가졌지만, McCain의 A₍7₎가 더 높아 향후 h‑값 상승이 더 클 것으로 예측되었다.
**한계와 향후 연구**
- 표본이 15명에 불과해 일반화에 제한이 있다. 다양한 분야와 규모의 연구자를 포함한 확장된 데이터셋이 필요하다.
- 반경 j를 고정하는 기준이 분야별 인용 문화 차이를 충분히 반영하지 못한다. 분야별 최적 j값을 탐색하는 추가 연구가 요구된다.
- 인용 데이터는 자기 인용·대규모 협업 등에 의해 왜곡될 수 있다. 이러한 요인을 보정하는 방법론이 병행되어야 한다.
**결론**
본 연구는 h‑지수의 구조적 한계를 보완하기 위해 ‘중심 영역 지표’와 ‘중심 구간 지표’라는 두 가지 새로운 정량적 도구를 제시하였다. 이 지표들은 인용 분포의 중앙 형태를 포착함으로써, 동일한 h‑값을 가진 연구자들 사이에서 선택적·대량 생산형 특성을 구분하고, 향후 연구 성과를 예측하는 데 유용함을 실증적으로 입증하였다. 따라서 연구자 평가, 학술 정책, 연구비 배분 등에서 보다 정교하고 공정한 판단을 가능하게 할 것으로 기대된다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기