이탈리아 대학 논문 오픈시테이션 적용 현황 분석
초록
본 연구는 이탈리아 6개 대학의 CRIS(IRIS) 시스템에 등록된 논문·도서·학위논문 등에 대해 DOI·PMID·ISBN을 이용해 OpenCitations 메타와 인덱스와 매칭함으로써 커버리지와 인용 정보를 평가한다. 평균 40% 이상의 논문이 OpenCitations에 포함되었으며, 인문·사회과학 분야의 단행본·비평판 등은 여전히 낮은 커버리지를 보인다.
상세 분석
이 논문은 오픈 연구 정보 활용을 촉진하고자, 현재 이탈리아 대학에서 널리 사용되는 IRIS 기반 CRIS 데이터를 OpenCitations와 비교 분석하였다. 연구는 2025년 7월 밀라노 워크숍에서 선정된 6개 대학(볼로냐, 밀라노, 토리노, 파도바, 피에몬테 동부, 피사 SNS)으로부터 SQL 쿼리 결과를 CSV 형태로 수집하고, 각 레코드에 포함된 DOI, PMID, ISBN을 추출하였다. ISBN은 단행본·비평판·번역서 등 특정 MIUR 분류에만 허용하도록 추가 검증을 거쳤으며, 중복 OMID(오픈시테이션 메타 식별자)와 OCI(오픈시테이션 식별자)도 정교히 정제하였다. 결과적으로 전체 1.6백만 건 중 260 k 건 이상의 유효 PID가 확보되었고, 이 중 평균 40 %가 OpenCitations 메타에 매칭되었다. 대학별 매칭 비율은 UNIMI(48 %)에서 UNITO(31 %)까지 차이를 보였으며, 이는 각 대학의 출판 유형 분포와 PID 부여 정책 차이에 기인한다. 인용 측면에서는 매칭된 레코드당 평균 33 건의 인용이 존재했으며, 인용·피인용 모두에서 약 34 건 정도가 기록되었다. 특히, IRIS 레코드 간 자체 인용(내부 인용)도 0.5 백만 건 이상 확인돼, 오픈시테이션 인프라가 학술 네트워크 분석에 충분히 활용될 수 있음을 시사한다. 그러나 저자·편집자 정보, 비정형 출판물(학위논문·보고서·학술지 외 기사) 등은 PID 부재 혹은 부정확한 매핑으로 인해 커버리지가 낮았다. 특히 인문·사회과학 분야에서 단행본·비평판·편집본이 크게 누락되었으며, 이는 ISBN이 컨테이너(전체 도서)만을 식별하고 챕터 수준은 별도 DOI가 없기 때문이다. 연구는 또한 OpenCitations 메타와 인덱스의 중복 데이터 문제를 해결하기 위한 정제 절차를 제시하고, 향후 IRIS‑OpenCitations 연동을 자동화할 수 있는 Python 패키지(iris‑oc‑mapper)를 공개함으로써 재현 가능성을 높였다. 전체적으로 오픈시테이션 인프라가 기존 상업 데이터베이스와 비교해 정량적 커버리지는 비슷하지만, 메타데이터 풍부성·다양성 측면에서 아직 개선 여지가 있음을 강조한다.
댓글 및 학술 토론
Loading comments...
의견 남기기