과학 지리 지도화 도시와 연구소 네트워크 분석

본 논문은 과학 논문의 주소 정보를 활용해 도시와 연구기관 간 협력 관계를 지리적 지도 위에 시각화하는 방법을 제시한다. Google Earth·Google Maps와 네트워크 분석 도구인 Pajek을 결합하여 전 세계 과학 협력 네트워크를 시각·통계적으로 분석하고, ISI·Scopus 데이터베이스와 시각화 툴 간의 연동을 위한 무료 소프트웨어를 제공한다.

과학 지리 지도화 도시와 연구소 네트워크 분석

초록

본 논문은 과학 논문의 주소 정보를 활용해 도시와 연구기관 간 협력 관계를 지리적 지도 위에 시각화하는 방법을 제시한다. Google Earth·Google Maps와 네트워크 분석 도구인 Pajek을 결합하여 전 세계 과학 협력 네트워크를 시각·통계적으로 분석하고, ISI·Scopus 데이터베이스와 시각화 툴 간의 연동을 위한 무료 소프트웨어를 제공한다. 도시 수준에서는 주소 데이터가 충분히 일관되어 신뢰성 있는 지도가 가능하지만, 기관명 통합 문제로 인해 조직 수준에서는 데이터 정제와 표준화가 필요함을 논한다.

상세 요약

이 연구는 과학 출판물에 포함된 저자 주소 정보를 지리적 좌표와 네트워크 구조로 변환하는 일련의 워크플로우를 상세히 기술한다. 첫 단계는 ISI Web of Science와 Scopus에서 추출한 원시 주소 데이터를 CSV 형식으로 저장한 뒤, 문자열 정규화와 토큰화 과정을 통해 도시명과 기관명을 분리한다. 도시명은 전 세계 표준 지명 데이터베이스(GeoNames)와 매칭하여 위도·경도 좌표를 부여하고, 이를 KML 파일로 변환해 Google Earth에 로드한다. 이때, 동일 도시가 여러 번 등장하면 중복을 제거하고 가중치를 부여해 시각적 강조가 가능하도록 설계하였다.

기관명은 국제 표준화가 미비해 동일 기관이 서로 다른 표기(예: “MIT”, “Massachusetts Institute of Technology”)로 기록되는 경우가 빈번하다. 저자는 Levenshtein 거리와 사전 기반 매칭을 결합한 클러스터링 알고리즘을 구현해 유사 문자열을 자동으로 통합하고, 남은 애매한 경우는 수작업 검증을 권장한다. 이렇게 정제된 기관 리스트는 Pajek 입력 파일(.net) 형태로 변환되어, 노드(기관)와 엣지(공동 논문) 간의 가중치(공동 논문 수)를 포함한다.

Pajek을 이용한 네트워크 분석에서는 중심성(베트위니, 클로즈니), 군집 계수, 모듈러리티 등을 계산해 과학 협력의 구조적 특성을 정량화한다. 특히, 도시 수준 네트워크와 기관 수준 네트워크를 별도로 분석함으로써, 지리적 근접성이 협력에 미치는 영향과 학문적 네트워크의 계층적 구조를 동시에 파악할 수 있다. 결과 시각화는 Pajek의 2D/3D 레이아웃과 Google Maps API를 연동해 인터랙티브하게 구현한다. 지도 위에 노드 크기와 색을 중심성 지표에 매핑하고, 엣지는 공동 논문 수에 비례해 두께를 조절한다. 사용자는 지도 확대·축소와 클릭을 통해 특정 도시·기관의 상세 협력 정보를 조회할 수 있다.

또한, 저자는 무료 오픈소스 스크립트(파이썬 기반)와 매크로를 제공하여, 비전문가도 데이터 추출·정제·시각화 전 과정을 자동화할 수 있도록 지원한다. 이 도구들은 Windows와 Linux 환경에서 동작하며, Google Earth와 Google Maps의 KML/KMZ 포맷을 직접 생성한다. 마지막으로, 데이터 품질 문제—특히 기관명 통일성 부족과 주소 누락—에 대한 한계와 향후 개선 방향을 논의한다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...