GLAM 기관을 위한 컬렉션 데이터 공개 체크리스트
초록
본 논문은 갤러리·도서관·아카이브·박물관(GLAM) 기관이 디지털 컬렉션을 연구용 데이터셋으로 전환·공개할 때 따를 수 있는 실용적인 체크리스트를 제시한다. 문헌 검토, 설문 조사, 사례 적용을 통해 4단계 절차와 30여 항목의 구체적 지침을 도출했으며, 소규모·중간 규모 기관의 실무 적용 가능성을 강조한다.
상세 분석
이 연구는 ‘컬렉션을 데이터로’ 전환하는 과정에서 발생하는 기술·법적·조직적 장벽을 체계적으로 정리하고, 이를 해결하기 위한 체크리스트를 설계한다는 점에서 의미가 크다. 먼저 저자들은 기존 문헌을 네 가지 카테고리(베스트 프랙티스, 데이터 품질, 체크리스트 정의, 전략·데이터 플랜, 사례·실험)로 분류하고, 각 카테고리에서 도출된 핵심 요소들을 메타데이터 표준(MARC XML, Dublin Core, JSON 등), 라이선스(CC0, 오픈 라이선스), API 제공 방식, 데이터 정제·보강 절차 등으로 구체화한다. 두 번째 단계에서는 2022년 10월에 진행된 온라인 설문을 통해 43개의 응답을 수집했으며, 응답자 대부분이 경험이 부족하고 초기 정보가 부족하다는 점을 확인했다. 설문 결과는 체크리스트에 ‘정보 제공·교육’, ‘전문 인력 확보’, ‘예산·인프라 계획’ 등 조직 차원의 지원 필요성을 반영하도록 설계에 반영되었다.
체크리스트 자체는 네 단계(주제 식별·문헌 검토, 요구사항 조사, 체크리스트 초안 작성, 적용·평가)와 30여 개 구체 항목으로 구성된다. 예를 들어, ‘데이터 포맷 선택’ 항목에서는 사용 목적에 맞는 구조화된 포맷(JSON-LD, CSV, RDF)과 장기 보존을 위한 포맷을 동시에 고려하도록 권고한다. ‘메타데이터 품질 관리’ 항목은 자동화된 검증 도구와 인간 검토 절차를 병행하고, ‘라이선스 명시’ 항목은 법적 위험을 최소화하기 위해 가능한 한 CC0 또는 동일한 오픈 라이선스를 명시하도록 제시한다. 또한 ‘접근성·재사용성’ 항목에서는 API 문서화, 샘플 쿼리 제공, 이용자 피드백 루프 구축 등을 강조한다.
실증 적용 단계에서는 영국 도서관, 네덜란드 국립도서관, 스코틀랜드 국립도서관 등 5개 기관의 실제 컬렉션을 대상으로 체크리스트를 적용하였다. 결과적으로 데이터 포맷 통일, 메타데이터 정제, 라이선스 재검토 등 구체적인 개선점이 도출되었으며, 특히 소규모 기관이 ‘전략·데이터 플랜’ 단계에서 장기적인 유지보수 계획을 수립하는 것이 중요함을 확인했다.
이 논문의 독창성은 기존 연구가 데이터 품질·실험 설계에 초점을 맞추었다면, 본 연구는 실무자 친화적인 체크리스트라는 구체적 도구를 제공함으로써 ‘컬렉션을 데이터로’ 전환하는 전 과정을 표준화하고, 특히 인력·예산이 제한된 기관이 손쉽게 채택할 수 있도록 설계했다는 점이다. 향후 연구에서는 체크리스트의 자동화 도구와 지속적인 피드백 메커니즘을 구축해, 국제적인 데이터 스페이스와 연계된 메타데이터 교환 표준을 확대 적용하는 방안을 모색할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기