스프레드시트 유지보수성 자동 평가를 위한 모델과 데이터베이스 구축 방안
초록
스프레드시트의 장기 사용과 다중 사용자 편집을 고려해, 자동화된 측정 기반 유지보수성 평가 모델을 제안한다. 기존 소프트웨어 유지보수성 평가 방법을 차용하고, 메트릭 정의·대규모 스프레드시트 저장소 구축·주기적 모델 보정을 핵심 요구사항으로 제시한다.
상세 분석
본 논문은 스프레드시트가 기업·재무·공학 등 다양한 분야에서 핵심 업무 도구로 활용되는 현실을 출발점으로 삼는다. 이러한 스프레드시트는 초기 프로토타입 단계에서 복잡한 비즈니스 로직을 구현하는 단계까지 진화하며, 수년간 유지·보수되는 경우가 빈번하다. 따라서 단순히 오류율만을 평가하는 기존 연구와 달리, “유지보수성(maintainability)”이라는 관점을 도입해, 스프레드시트를 얼마나 쉽게 이해·진단·수정·검증할 수 있는가를 정량화하려는 시도가 필요함을 강조한다.
논문은 두 가지 핵심 요소를 제시한다. 첫째, 자동화된 정적 분석을 통해 셀, 수식, 시트 등 저수준 요소를 계량화하고, 이를 ISO/IEC 9126의 유지보수성 하위 특성(예: 가독성, 복잡도, 중복성)과 연결하는 계층형 품질 모델을 구축한다. 이 모델은 SIG가 소프트웨어에 적용해 온 “측정‑평가‑보정” 사이클을 그대로 차용한다. 측정값은 0.55.5 구간의 등급으로 변환돼 별점(15) 형태로 시각화되며, 위험 프로파일(낮음·보통·높음·매우높음) 기반 임계값을 통해 정량적·정성적 해석을 가능하게 한다.
둘째, 모델을 실증적으로 보정하고 검증하기 위한 대규모 스프레드시트 저장소의 필요성을 역설한다. 현재 EUSES 코퍼스가 존재하지만, 공개·비전문적 파일 위주, 메타데이터 부족, 법적·시대적 제약 등 한계가 명확하다. 따라서 저자들은 “큐레이팅·동적·오픈·유용성” 네 가지 원칙을 갖춘 커뮤니티 기반 저장소를 제안한다. 큐레이팅 단계에서는 파일의 실행 가능성·업무 연관성을 검증하고, 동적 관리에서는 지속적인 버전 업데이트와 주기적 재보정을 수행한다. 오픈 접근성을 유지하되, 보안·프라이버시 요구가 있는 경우 NDA 기반 제한 접근도 허용한다.
측정 목표 설정에는 GQM(Goal‑Question‑Metric) 방법론을 적용한다. 최종 목표는 스프레드시트 유지보수성 평가이며, 이를 위해 “이해 용이성”, “변경 위험”, “검증 비용” 등 구체적 질문을 도출하고, 각 질문에 대응하는 메트릭(예: 수식 복잡도, 셀 의존성 그래프, 중복 수식 비율 등)을 선정한다. 이후 대규모 샘플에 적용해 통계적 분포와 임계값을 도출하고, 소프트웨어 분야에서와 동일한 보정 절차를 거쳐 모델을 최적화한다.
이러한 접근법은 객관성·재현성·비용 효율성·확장성 측면에서 기존 전문가 기반 평가를 뛰어넘을 수 있다. 특히, 자동화된 도구는 수천 개의 스프레드시트를 빠르게 스캔해 위험 영역을 시각화하고, 조직 차원에서 유지보수성 개선 우선순위를 정하는 데 활용될 수 있다.
결론적으로, 논문은 스프레드시트 유지보수성 평가를 위한 체계적 모델과 데이터 인프라 구축이 시급함을 역설하고, 커뮤니티 참여를 통한 저장소 조성을 촉구한다. 이는 스프레드시트 오류 관리뿐 아니라 장기적인 비즈니스 리스크 감소와 품질 향상에 기여할 것으로 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기