저자 수준 성과 지표 클러스터 분석

이 연구는 천문학, 환경과학, 철학, 공중보건 분야의 741명 연구자를 대상으로 44가지 저자‑수준 지표를 계산하고, 두 단계 클러스터링과 로지스틱 회귀를 통해 성과 등급을 구분한다. 결과는 학문 분야마다 특정 지표가 성과 구분에 유효함을 보여주며, 연차보다 연구 연혁·출판·인용 수가 지표 점수에 더 큰 영향을 미친다.

저자 수준 성과 지표 클러스터 분석

초록

이 연구는 천문학, 환경과학, 철학, 공중보건 분야의 741명 연구자를 대상으로 44가지 저자‑수준 지표를 계산하고, 두 단계 클러스터링과 로지스틱 회귀를 통해 성과 등급을 구분한다. 결과는 학문 분야마다 특정 지표가 성과 구분에 유효함을 보여주며, 연차보다 연구 연혁·출판·인용 수가 지표 점수에 더 큰 영향을 미친다.

상세 요약

본 논문은 저자 수준의 정량적 성과를 평가하기 위해 44개의 다양한 지표를 선정하고, 이를 실제 연구자의 경력과 연결시키는 방법론적 시도를 제시한다. 데이터는 Web of Science에서 추출한 741명의 연구자(천문학 186명, 환경과학 184명, 철학 184명, 공중보건 187명)에 대해 2000년 이후 첫 논문부터 현재까지의 출판 건수와 인용 횟수를 기반으로 구축되었다. 지표는 전통적인 h‑index, g‑index, e‑index와 같은 핵심 지표부터, h2, Q2, sum pp top prop 등 분야별 특성을 반영한 변형 지표까지 포함한다.

클러스터링은 IBM SPSS Statistics 22의 두 단계(두 단계) 절차를 이용했으며, 첫 단계에서는 자동 선택된 변수와 거리 측정 방식을 통해 최적의 클러스터 수를 추정하고, 두 번째 단계에서는 K‑means 알고리즘으로 실제 클러스터를 형성한다. 결과적으로 네 개의 클러스터(극저성, 중간, 고성, 초고성)가 도출되었으며, 각 클러스터는 지표 점수의 분포와 일치한다.

클러스터 소속을 예측하기 위해 위험 분석과 순서형 로지스틱 회귀를 수행했는데, 주요 설명 변수는 (1) 첫 출판 이후 경과 연수, (2) 총 출판 건수, (3) 총 인용 횟수였다. 학문적 연차(예: 박사후, 조교수, 부교수 등)는 두 번째 수준의 변수로 남았으며, 통계적으로 유의미한 영향력을 보이지 않았다. 이는 저자 수준 지표가 개인의 연구 생산성(양)과 영향력(질)과 더 강하게 연관되고, 전통적인 직급 구분보다 실제 연구 활동 기간과 규모에 의해 좌우된다는 점을 시사한다.

학문 분야별로 가장 구분력이 높은 지표는 다음과 같다. 천문학에서는 h2가, 환경과학에서는 sum pp top prop가, 철학에서는 Q2가, 공중보건에서는 e‑index가 각각 최고 성과와 저성능을 명확히 구분하였다. 이러한 결과는 각 분야가 인용 문화와 출판 관행이 다르기 때문에, 단일 지표만으로는 모든 분야를 포괄적으로 평가하기 어렵다는 기존 논의를 뒷받침한다.

또한, 연구자들의 이력서(CV)와 지표 기반 평가 사이에 ‘일반적인 불일치’가 관찰되었다. 일부 연구자는 다수의 저명한 저널 논문과 프로젝트 참여를 강조했음에도 불구하고, 인용 기반 지표에서는 낮은 점수를 받았으며, 반대로 인용이 많이 축적된 연구자는 실제 연구 활동이 제한적이라는 평가를 받았다. 이는 정량적 지표만으로 연구자의 전체 역량을 판단하기엔 한계가 있음을 강조한다.

방법론적 한계로는 데이터 수집 시 WoS에 등재되지 않은 출판물(예: 지역 학술지, 회의 논문) 누락, 그리고 지표 계산에 사용된 전처리 과정의 주관성 등이 있다. 저자들은 이러한 한계를 보완하기 위해 추가적인 정성적 평가, 동료 평가, 그리고 다중 데이터베이스(Scopus, Google Scholar) 활용을 제안한다.

결론적으로, 클러스터 분석은 분야별 특화된 지표를 식별하고, 연구자 성과를 다차원적으로 구분하는 데 유용한 도구임을 확인했다. 그러나 지표 선택과 해석에 있어 사전 데이터 정제와 후속 검증 절차가 필수적이며, 단순히 지표 점수에 의존하기보다는 이력서와 같은 정성적 정보와 병행하는 것이 바람직하다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...