ARL 도서관과 연구비 연관성 분석: 도서관 변수의 실제 영향은?

본 연구는 미국 ARL 회원 대학 99곳을 대상으로 도서관·기관·연구 인프라 데이터를 결합해 2012년 총 연구비(명목·인당)와의 관계를 선형, 로지스틱, 누적 로짓 모델로 분석한다. 변수 선택 과정에서 대부분의 도서관 관련 지표가 연구비와의 상관이 약하거나 모델에 포함되지 않았으며, 연구비 예측에 가장 큰 영향을 미치는 것은 도서관이 아닌 대학 규모·연구 시설·교원·인건비 등 비도서관 요인임을 확인한다.

저자: Ryan P. Womack

ARL 도서관과 연구비 연관성 분석: 도서관 변수의 실제 영향은?
이 연구는 미국 연구도서관 협회(ARL) 회원인 99개 대학 도서관을 대상으로, 2012년 기준의 연구비 총액을 연구 성과의 주요 지표로 삼아 도서관, 학술·인프라, 인력 등 다양한 요인이 연구비에 미치는 영향을 정량적으로 분석한다. 데이터는 세 가지 주요 출처에서 수집되었다. 첫째, NSF의 National Center for Science and Engineering Statistics(NCSES)에서 제공하는 HERD(Higher Education Research and Development) 조사로 대학별 총 연구비와 연방·주·민간·내부 자금 등을 포함한 금액을 확보했다. 둘째, ARL Statistics에서 도서관 규모, 예산, 직원 수, 자료 이용 통계 등 75개의 도서관 관련 변수를 얻었다. 셋째, IPEDS에서 교직원 수, 급여 총액, 전일제(FTE) 직원 수 등 비도서관 인력·재정 지표를 수집했다. 이 세 데이터셋을 병합해 99개 기관에 대해 75개의 잠재 설명 변수를 구성했으며, 결측치 처리와 로그 변환을 통해 변수들의 비정규성을 보정하였다. 연구는 세 차원에서 모델링을 진행했다. 첫 번째 차원은 설명 변수 집합을 ‘도서관 전용’, ‘학술·인프라 전용’, ‘통합’ 세 그룹으로 나누어 각각의 예측력을 비교하였다. 두 번째 차원은 종속 변수 형태를 연속형(연구비 명목액), 이진형(연구비 400백만 달러 기준 고·저), 그리고 4단계 순위형(≤200, 200‑400, 400‑700, >700백만 달러)으로 설정하고, 선형 회귀, 로지스틱 회귀, 누적 로짓 모델을 적용하였다. 세 번째 차원은 연구비를 ‘명목액’과 ‘교원 1인당 인당 연구비(Per Capita)’ 두 형태로 나누어 분석함으로써 규모 효과를 통제하였다. 변수 선택 과정에서는 먼저 스피어만 상관분석을 통해 도서관 변수 중 지역·가입 연도와 같이 정책적 통제가 어려운 변수와, 절대 상관계수가 0.1 미만인 변수(예: 파트타임 학생 수, 일부 데이터베이스 검색 횟수)를 제외하였다. 이렇게 29개의 도서관 변수가 남았으며, 모두 로그 변환 후 단계적 회귀(stepwise AIC) 절차에 투입되었다. 단계적 회귀는 최소 모델(예: 도서관 자료량)에서 시작해 변수를 추가하거나, 최대 모델(전체 변수)에서 변수를 차감하는 전·후진 방식을 병행했으며, AIC 기준으로 모델 적합도와 복잡성을 동시에 고려하였다. 분석 결과, 비도서관 변수—특히 총 교원 수, 연구 시설(연구실·실험실) 면적, 총 급여비—가 연구비 예측에 가장 큰 영향을 미치는 것으로 나타났다. 도서관 변수는 일부 모델에서 통계적으로 유의미한 계수를 보였지만, 그 효과 크기는 매우 작았으며, 통합 모델에서도 비도서관 변수에 의해 대부분의 설명력이 대체되었다. 특히, 4단계 순위형 모델과 이진 로지스틱 모델 모두 도서관 변수의 포함 여부가 모델의 AIC 차이에 거의 영향을 주지 않았으며, 이는 도서관이 연구비 확보에 직접적인 인과관계보다는 고연구 역량을 가진 대학에 자연스럽게 동반되는 현상임을 시사한다. 연구는 또한 연속형 연구비와 범주형(4단계) 연구비 간 상관 차이가 0.052 이하로 미미함을 확인해, 범주형 모델이 데이터 손실 없이 충분히 설명력을 제공함을 보여준다. 이는 연구비를 구간화해 모델링함으로써 표본 크기를 균등하게 유지하고, 변수당 최소 10개의 관측치를 확보하려는 ‘10:1 규칙’을 만족시키는 데 유리했다. 결론적으로, 이 논문은 도서관 변수만으로는 대학 연구비를 충분히 설명할 수 없으며, 연구비 예측에 있어서는 대학 규모, 연구 인프라, 인력·재정 투입이 핵심 요인임을 밝혀냈다. 저자는 향후 연구에서 도서관 서비스 이용 패턴(예: 데이터베이스 활용도, 연구 지원 프로그램 참여율)과 같은 미세 지표를 포함하고, 장기적인 시계열 분석을 통해 인과관계를 보다 명확히 규명할 필요가 있다고 제언한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기