arXiv 정량생물학 섹션에 사전출판이 주는 실질적 이점은

arXiv 정량생물학 섹션에 사전출판이 주는 실질적 이점은

초록

본 논문은 arXiv의 Quantitative Biology 섹션에 사전출판(프리프린트)된 논문이 전통적인 저널 출판과 비교해 인용·출판 지연 측면에서 어떤 이점을 제공하는지 분석한다. 12개 주요 학술지를 대상으로 2010‑2022년 사이의 논문을 선정해 사전출판 비율, 출판 지연, 인용 횟수 등을 비교했으며, 전반적으로 프리프린트 제출이 증가하고 있으나 전체 생물학 연구 대비 비중은 낮다. 특히 Journal of Theoretical Biology에 한해 프리프린트 논문이 평균 1.8배 높은 인용수를 기록해 통계적으로 유의한 인용 이점을 보였다. 다른 저널에서는 인용 차이가 미미하거나 없었다. 연구 결과는 프리프린트가 출판 지연을 크게 단축시키는 장점은 확인했지만, 인용 측면에서는 분야·저널에 따라 차이가 있음을 시사한다.

상세 분석

본 연구는 Quantitative Biology 분야에서 arXiv 프리프린트가 실제로 학술적 가치를 창출하는지를 정량적으로 검증하고자 한다. 데이터 수집 단계에서 12개의 대표 저널(예: Journal of Theoretical Biology, PLOS Computational Biology 등)을 선정하고, 각 저널에 게재된 논문 중 DOI가 부여된 2010‑2022년 논문을 대상으로 arXiv에 사전 공개된 버전(e‑print)의 존재 여부를 Crossref 및 arXiv API를 통해 확인하였다. 이후 논문의 출판 지연(publication delay)은 저널에 최종 게재된 날짜와 arXiv에 업로드된 날짜의 차이로 정의했으며, 인용 지연(citation delay)은 프리프린트 업로드 후 최초 인용이 발생한 시점을 기준으로 측정하였다. 인용 횟수는 Web of Science와 Scopus를 병합해 3년(출판 연도+2년) 동안 누적된 총 인용 수를 사용하였다. 통계 분석은 프리프린트 논문과 비프린트 논문 사이의 평균 차이를 검증하기 위해 Welch’s t‑test와 비모수 검정인 Mann‑Whitney U 검정을 병행했으며, 저널별 효과를 파악하기 위해 다변량 회귀모델에 ‘저널 종류’, ‘연도’, ‘저자 수’, ‘기관 협업 정도’를 공변량으로 포함시켰다. 결과적으로 전반적인 출판 지연은 프리프린트 논문이 평균 8개월 정도 단축되는 것으로 나타났으며, 이는 전통적인 피어리뷰 과정이 평균 12개월 이상 소요되는 점과 비교해 의미 있는 차이였다. 그러나 인용 측면에서는 대부분의 저널에서 프리프린트 논문이 비프린트 논문보다 유의미하게 높은 인용수를 보이지 않았다. 유일하게 통계적으로 유의한 인용 이점을 보인 저널은 Journal of Theoretical Biology였으며, 이 경우 프리프린트 논문의 평균 인용수는 비프린트 논문 대비 약 1.8배 높았다. 이는 해당 저널이 이론적 모델링과 수학적 접근을 중시하는 특성상, 연구 결과가 빠르게 공유될 경우 커뮤니티 내에서 즉각적인 활용과 검증이 이루어지는 메커니즘이 작용했을 가능성을 시사한다. 한편, 프리프린트 논문의 저자 특성을 살펴보면, 다기관·다국가 협업이 활발한 논문일수록 프리프린트 제출 비율이 높았으며, 이는 연구 네트워크가 활발한 분야일수록 사전 공개를 통한 가시성 확보를 전략적으로 활용한다는 점을 보여준다. 연구의 제한점으로는 arXiv에 업로드된 모든 버전이 동일한 품질을 보장하지 않으며, 일부 논문은 최종 출판 전 수정·보완이 이루어졌을 가능성이 있다는 점, 그리고 인용 데이터가 저널별 인용 정책 차이에 영향을 받을 수 있다는 점을 들 수 있다. 전반적으로 본 연구는 프리프린트가 출판 지연을 크게 단축시키는 효과는 명확히 확인했지만, 인용 측면에서의 이점은 저널·연구 분야에 따라 크게 달라진다는 중요한 교훈을 제공한다.