학술지 순위가 과학 신뢰성에 미치는 역효과

이 논문은 현재 학술지 순위(Impact Factor 등)를 과학적 평가 지표로 사용하는 것이 연구의 신뢰성을 저해한다는 다양한 실증 데이터를 종합한다. 높은 순위 저널에 실린 논문이 재현성, 통계적 건전성, 부정행위 비율 등에서 낮은 순위 저널보다 열등함을 보여주며, 궁극적으로는 저널 자체를 대체하는 디지털 라이브러리 기반 시스템을 제안한다.

저자: Bj"orn Brembs, Marcus Munaf`o

학술지 순위가 과학 신뢰성에 미치는 역효과
본 논문은 학술지 순위가 과학적 품질 평가에 미치는 부정적 영향을 체계적으로 검토한다. 서론에서는 과학이 사회에 미치는 영향과 신뢰성 확보의 중요성을 강조하며, 현재 학술지 계층 구조가 연구자들의 제출·읽기 전략을 좌우하고 있음을 지적한다. 이어서 ‘재traction’ 현상의 급증을 소개한다. 1970년대 이후 안정적이던 재traction 비율이 2000년대 초 0.001%에서 0.02%로 상승했으며, 특히 고임팩트 저널에서 부정행위에 의한 재traction 비율이 두드러진다. 이는 저널 가시성이 오류 탐지를 촉진한다는 가설과, 고위험 연구가 고위험 저널에 집중된다는 두 가지 설명이 공존함을 시사한다. ‘디클라인 효과’ 섹션에서는 초기 고 IF 저널에 발표된 연구가 이후 저널에서 재현될 때 효과 크기가 감소하는 현상을 제시한다. Munafò et al. (2007)의 DRD2‑알코올 유전연관 연구를 예로 들어, 발표 연도가 늦어질수록 효과 크기가 감소하고, 초기 논문이 실린 저널의 IF가 클수록 초기 효과가 과대평가되는 경향을 보여준다. 이는 고위험 저널이 혁신성과 ‘놀라움’을 과도히 강조하면서 통계적 오류를 용인할 가능성을 보여준다. 다음으로 메타분석 데이터를 통해 저널 순위와 연구 품질 지표 사이의 관계를 다룬다. 유전학 분야에서는 개별 연구가 실제 효과 크기보다 얼마나 과대추정했는지를 나타내는 ‘bias score’가 저널 IF와 양의 상관관계를 보였다(Fig. 1c). 또한, 결정학 분야에서는 고 IF 저널에 실린 단백질 구조의 품질이 낮다는 보고가 있다. 의료·심리학 분야에서는 IF와 근거 수준, CONSORT 준수 등 사이에 일관된 상관관계가 발견되지 않았으며, 오히려 저널 순위가 낮을수록 통계적 가이드라인 준수가 더 좋을 수도 있음을 시사한다. 특히, Button et al. (2013)의 신경과학 650편 연구에서는 IF와 통계적 파워 사이에 전혀 상관이 없었으며, 이는 저널 순위가 실제 연구 설계·분석의 엄격함을 반영하지 못한다는 강력한 증거다. 재현성 섹션에서는 전임상 의학 분야에서 수행된 3건의 대규모 복제 연구가 모두 낮은 복제 성공률을 보였으며, 저널 순위와 복제 가능성 사이에 뚜렷한 관계를 찾지 못했다. 이는 고위험 저널에 실린 연구조차 재현 가능성이 낮다는 점을 강조한다. 사회학적 메커니즘을 분석한 부분에서는 ‘출판 압력’, ‘경쟁 심화’, ‘경력 불안정’ 등이 연구자에게 긍정적 결과를 고위험 저널에 제출하도록 유도하고, 이는 부정행위와 출판 편향을 촉진한다는 논리를 전개한다. 고 IF 저널이 높은 가시성을 제공함으로써 오류가 더 빨리 발견될 가능성도 있지만, 동시에 저널 자체가 높은 기대와 압력을 부여해 연구 품질을 저하시킨다는 이중적 효과가 존재한다. 결론에서는 현재의 저널 기반 평가 체계가 근본적인 문제를 안고 있음을 강조하고, 저널 자체를 폐지하고 디지털 라이브러리 기반의 새로운 학술 커뮤니케이션 시스템을 도입할 것을 제안한다. 이 시스템은 메타데이터, 오픈 피어리뷰, 알고리즘 기반 필터링 등을 활용해 논문의 질을 객관적으로 평가하고, 연구자와 독자가 필요에 따라 효율적으로 탐색·발견할 수 있도록 설계된다. 저자는 이러한 전환이 과학의 신뢰성을 회복하고, 연구 평가를 보다 투명하고 공정하게 만들 수 있는 길이라고 주장한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기