문헌 조사 올바른 방법 논문 저자들이 놓치는 이유
초록
본 논문은 연구자가 논문을 작성할 때 참고문헌을 선택하는 두 가지 필수 원칙, 즉 연구 내용과의 유사성 고려와 인용 네트워크를 통한 체계적 탐색이 실제로 지켜지지 않음을 보여준다. 저자들은 복잡계 네트워크 이론을 활용해 arXiv 데이터셋을 분석했으며, 대부분의 인용이 내용적 연관성보다 저자·저널의 인지도에 의해 편향됨을 확인했다.
상세 분석
이 연구는 과학 출판물에서 인용 횟수가 연구자 평가와 저널 임팩트 팩터 산정에 핵심 지표가 된다는 전제에서 출발한다. 따라서 인용 선택이 ‘내용적 유사성’과 ‘체계적 인용 탐색’이라는 두 가지 객관적 기준에 의해 이루어져야 공정한 평가가 가능하다고 주장한다. 저자들은 복잡 네트워크 이론을 도입해 논문 간 인용 관계를 그래프 형태로 모델링하고, 각 논문의 토픽 유사도를 텍스트 마이닝 기법(LDA 등)으로 정량화하였다. 이후 두 가지 기준을 정량적으로 검증하기 위해 다음과 같은 지표를 정의했다. 첫째, ‘내용 유사도 점수’가 높은 논문이 실제 인용 목록에 포함되는 비율; 둘째, ‘인용 네트워크 탐색 깊이’를 측정해 저자들이 인용망을 얼마나 넓게 탐색했는지를 평가했다. 두 개의 arXiv 서브셋(물리학·컴퓨터 과학)에서 10,000편 이상의 논문을 대상으로 실험했으며, 결과는 기대와 크게 달랐다. 내용 유사도가 높은 논문일수록 인용될 확률이 낮았고, 인용망 탐색은 주로 직접적인 인용 관계에 국한되어 ‘시드 논문’ 주변에만 집중되는 경향을 보였다. 특히 유명 저자·저널의 논문이 내용적으로 덜 연관돼도 과도하게 인용되는 현상이 뚜렷했다. 이는 연구자 개인의 인지도, 기관·국가적 네트워크, 그리고 저널의 명성 등이 인용 선택에 큰 영향을 미친다는 것을 시사한다. 저자들은 이러한 편향이 과학적 진보를 저해하고, 신생 연구자와 새로운 아이디어의 가시성을 감소시킨다고 경고한다. 마지막으로, 연구자는 인용 선택 과정에 자동화된 문헌 탐색 도구와 투명한 인용 정책을 도입해 현재의 비합리적 관행을 개선할 것을 제안한다.
댓글 및 학술 토론
Loading comments...
의견 남기기