학술출판사 순위의 현주소와 방법론적 과제
BiPublishers 프로젝트는 2009‑2013년 기간의 Book Citation Index 데이터를 활용해 254개 출판사를 42개의 분야·학문별 순위로 평가하였다. 출력, 영향, 출판사 프로필이라는 세 가지 차원에서 6가지 지표를 제시하고, 상업 출판사와 대학 출판사를 구분한다. 논문은 주요 결과를 제시하고, 데이터 한계·분류 오류・인용 특성 등 순
초록
BiPublishers 프로젝트는 2009‑2013년 기간의 Book Citation Index 데이터를 활용해 254개 출판사를 42개의 분야·학문별 순위로 평가하였다. 출력, 영향, 출판사 프로필이라는 세 가지 차원에서 6가지 지표를 제시하고, 상업 출판사와 대학 출판사를 구분한다. 논문은 주요 결과를 제시하고, 데이터 한계·분류 오류・인용 특성 등 순위 구축 시 직면한 방법론적 문제들을 논의한다.
상세 요약
본 논문은 학술 서적 분야에서 처음으로 체계적인 출판사 순위 체계를 시도한 점에서 의의가 크다. 데이터 원천으로 사용된 Book Citation Index(BCI)는 2009‑2013년 사이에 수록된 도서와 그 인용 정보를 제공하지만, 서적 인용의 특성이 논문 인용과 크게 다르다는 점을 간과해서는 안 된다. 서적은 인용 주기가 길고, 동일한 저작물이 여러 판본·번역본으로 존재할 가능성이 높으며, 인용이 교과서·전문서 등 비학술적 출처에서도 발생한다. 이러한 특성은 ‘총 인용수’와 같은 전통적 충격지표가 출판사의 실제 학술적 영향력을 과대·과소 평가할 위험을 내포한다.
연구진은 출력(output), 영향(impact), 출판사 프로필(profile)이라는 세 가지 차원에 각각 두 개씩, 총 6개의 지표를 설계하였다. 출력 차원은 ‘출판된 도서 수’와 ‘연간 평균 도서 수’를, 영향 차원은 ‘총 인용수’와 ‘인용당 평균 도서 수’를, 프로필 차원은 ‘학문 분야 다양성’과 ‘상업·대학 출판사 비율’을 측정한다. 이 중 특히 ‘학문 분야 다양성’은 각 출판사가 다루는 학문 영역의 폭을 Shannon entropy 방식으로 정량화했으며, 이는 출판사의 포트폴리오 전략을 파악하는 데 유용하다. 그러나 지표 간 상관관계가 높아 중복된 정보를 제공할 가능성이 존재한다는 점에서 다중공선성 검증이 필요하다.
분류 체계 측면에서, 연구진은 254개 출판사를 ‘상업 출판사’와 ‘대학 출판사’로 이원화했지만, 실제로는 대학 출판부를 운영하는 상업 출판사, 혹은 비영리 연구기관이 운영하는 소규모 출판사 등 혼합형이 다수 존재한다. 이러한 이분법적 구분은 출판사의 운영 목적·재정 구조를 정확히 반영하지 못한다는 비판을 받을 수 있다. 또한 BCI 자체가 영어권 출판물에 편중되어 있어 비영어권 출판사의 인용이 과소평가되는 구조적 편향이 존재한다.
방법론적 문제로는 (1) 데이터 누락·중복, (2) 인용 데이터의 시간 지연, (3) 분야·학문별 분류의 모호성, (4) 지표 가중치 설정의 주관성 등을 들 수 있다. 특히 분야·학문 구분은 BCI가 제공하는 ‘Subject Category’를 그대로 사용했는데, 이는 서적의 다학제적 특성을 충분히 포착하지 못한다. 저자들은 향후 서지 메타데이터와 텍스트 마이닝을 결합해 보다 정교한 분류 체계를 구축할 필요성을 강조한다.
결과적으로, BiPublishers는 출판사 순위라는 새로운 평가 도구를 제시했지만, 데이터 품질·분류 정확도·지표 설계 등 여러 측면에서 보완이 요구된다. 향후 연구는 다중 데이터 소스(예: Scopus Books, Google Scholar, 도서관 대출 기록)와 정량·정성 혼합 방법을 도입해 출판사의 학술적 기여를 보다 포괄적으로 측정하는 방향으로 나아가야 할 것이다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...