정보과학 분야 도시별 논문 생산과 인용 영향력 기대치를 초과한 지역 탐색

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 1989‑2009년 사이 정보과학 분야에서 발표된 논문을 대상으로, 각 도시의 고인용 논문 수와 통합 인용지표(I3)를 기대값과 비교해 통계적으로 유의미한 초과·미달을 시각화한다. 기존 z‑검정 기반 매핑 방법을 개선하고, I3·RI3R 지표를 활용한 새로운 지도 작성 절차를 제시한다.

상세 분석

이 연구는 Bornmann과 Leydesdorff가 제안한 ‘도시별 고인용 논문 기대값 대비 실측값’ 분석 프레임워크를 확장한다. 먼저 Web of Science(WoS) SSCI 데이터베이스에서 1989‑2009년 사이에 발표된 정보과학 분야 핵심 저널(Annual Review of Information Science and Technology, Information Processing & Management 등)에서 ‘Article’ 유형만을 추출해 6,242편의 논문 집합을 구축하였다. 고인용 논문은 전체 논문 중 상위 10%에 해당하는 논문으로 정의했으며, 각 논문의 인용 윈도우는 논문 발표 연도부터 2011년 7월 데이터 수집 시점까지였다.

통계적 검증 단계에서는 두 독립 비율에 대한 z‑검정을 적용한다. 기대값은 해당 도시의 전체 논문 수에 10%를 곱한 값이며, 기대값이 5편 이상일 때만 유의성 검정을 수행한다. z값 절대값이 1.96을 초과하면 p<0.05, 2.58 초과하면 p<0.01, 3.29 초과하면 p<0.001로 구분해 별표(***, **, *)로 표시한다. 시각화는 원의 반경을 |관측값‑기대값|+1 로 정의하고, 색상은 초과(녹색 계열)와 미달(빨강·주황 계열)으로 구분한다. 기대값이 5 미만인 경우는 회색 또는 라임그린으로 표시해 해석에 주의를 요구한다.

새롭게 도입된 I3(Integrated Impact Indicator) 지표는 논문별 백분위수 점수를 합산해 전체 집합의 인용 영향을 정량화한다. 상위 1% 논문은 100점, 평균 논문은 50점 등으로 재스케일링해 서로 다른 인용 분포를 직접 비교 가능하게 만든다. I3의 기대값은 논문 수에 비례하도록 설정하고, 관측 I3와 기대 I3의 차이를 동일한 z‑검정 절차로 평가한다. 또한 I3를 논문 수로 나눈 I3/n(=RI3R) 지표를 도입해 평균 인용 영향을 비교했으며, 이 경우 작은 도시가 상대적으로 유리해지는 편향을 보정하기 위해 최소 논문 수를 5편으로 제한하였다.

지도 제작 파이프라인은 ‘cities1.exe’, ‘cities2.exe’, ‘topcity4.exe’ 등 일련의 전용 프로그램을 이용한다. cities1.exe는 원시 WoS 텍스트 파일을 도시명 리스트로 변환하고, GPS Visualizer 혹은 Sci2 Tool을 통해 위도·경도 좌표를 부여한다. 이후 cities2.exe가 좌표가 포함된 파일을 받아 통계값을 계산하고, topcity4.exe가 선택된 백분위수(10%)와 최소 논문 수(5편) 기준으로 z‑검정 결과 파일(ztest.txt)과 DBF 형식 데이터(ucities.dbf)를 생성한다. 최종적으로 GPS Visualizer에 입력해 Google Maps 기반 인터랙티브 지도를 만든다.

I3 계산을 위한 별도 절차는 ‘ISI.exe’, ‘isi2i3.exe’ 등을 사용해 WoS 태그형 데이터베이스를 DBF 형태로 변환하고, 각 논문의 백분위수(i3f, i3j)와 6가지 NSF 백분위수(r6f, r6j)를 부여한다. 이때 Rousseau의 “≤” 방식(동등 인용 포함)으로 백분위수를 산출해 작은 표본에서도 상위 백분위에 도달할 기회를 보장한다.

본 논문은 기존 매핑 방법의 한계—예를 들어 기대값이 작아 통계 검정이 불가능한 경우, 다년간 데이터를 한 번에 처리하지 못하는 점—를 보완하고, I3 기반 인용 영향 지도라는 새로운 차원을 추가함으로써 도시별 과학적 우수성을 보다 정교하게 평가한다. 다만, 도시명 표준화 문제, 다중 저자·다기관 협업 시 ‘정수 카운팅’ 방식의 한계, Bonferroni 보정 미적용에 따른 다중 비교 오류 가능성 등은 향후 연구에서 보완이 필요하다.

정보과학 분야 도시별 논문 생산과 인용 영향력 기대치를 초과한 지역 탐색

초록

상세 분석

댓글 및 학술 토론

의견 남기기