범위 이름이 스프레드시트 공식 개발에 미치는 영향: 신뢰성 및 시간 분석

범위 이름이 스프레드시트 공식 개발에 미치는 영향: 신뢰성 및 시간 분석
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 연구는 초·중급 사용자에게 범위 이름을 사용한 간단한 합계 공식이 오류 발생률과 개발 시간을 어떻게 변화시키는지 실험적으로 조사하였다. 여섯 가지 네이밍 규칙을 적용한 12개의 과제를 두 차례 시행한 결과, 범위 이름을 사용할 경우 오류가 더 많이 발생하고, 공식 작성에 소요되는 시간이 평균적으로 15 %~25 % 증가함을 통계적으로 입증하였다. 즉, 비전문가에게는 범위 이름이 오히려 생산성을 저해한다는 결론을 도출하였다.

상세 분석

이 논문은 스프레드시트 개발을 ‘프로그래밍’의 한 형태로 보고, 전통적인 프로그래밍에서 변수명 규칙이 가독성과 유지보수에 미치는 긍정적 효과가 스프레드시트에도 그대로 적용될 것이라는 가설을 검증하려는 시도이다. 저자들은 먼저 기존 연구에서 범위 이름이 디버깅 성능을 저해한다는 결과를 제시했으며, 이번에는 공식 작성 단계에서의 영향을 집중적으로 탐구한다.

실험 설계는 ‘within‑subject’ 방식으로, 동일 참가자가 6가지 네이밍 구조(동일 접두어, 동일 접미어, 중간 숫자 변형 등)와 셀 직접 참조를 번갈아 사용하도록 하였다. 두 차례에 걸친 시행(첫 번째는 15명의 대학원생, 두 번째는 17명의 2학년 소프트웨어 개발 전공 학생)으로 표본 크기를 확대하고, 첫 시행에서 드러난 네이밍 혼동(예: GP와 NP) 등을 보완하였다.

주요 측정 지표는 (1) 공식의 정확도(정답 여부)와 (2) 작업 완료 시간이다. 시간 측정은 백그라운드 매크로(T‑CAT)를 이용해 밀리초 단위로 기록했으며, 오류는 공식이 요구된 7개의 셀/범위 합산을 정확히 수행했는지 여부로 판단하였다.

통계 분석에서는 각 네이밍 유형별로 오류율과 평균 시간 차이가 유의미함을 보여준다. 특히 ‘구조가 전혀 없는 무작위 네이밍’(type f)에서는 오류 발생률이 가장 높았으며, ‘접두어만 동일하고 뒤에 숫자만 다른’(type d) 경우에도 셀 참조 대비 평균 18 % 이상의 시간 증가가 관찰되었다. 반면, 가장 엄격한 규칙을 적용한 ‘동일 접두어가 겹치지 않는’(type a) 경우에도 여전히 셀 직접 참조보다 오류가 7 % 정도 더 많이 발생하고, 시간은 12 % 정도 더 소요되었다.

이러한 결과는 두 가지 중요한 시사점을 제공한다. 첫째, 범위 이름 자체가 인지 부하를 증가시켜 초·중급 사용자의 작업 효율을 저하시킨다. 둘째, 네이밍 규칙이 얼마나 체계적이든 간에, 비전문가가 이를 기억하고 정확히 적용하기는 어려운 것으로 보인다. 따라서 범위 이름을 도입하려는 조직은 사용자를 교육하거나, 자동화 도구(예: 이름 자동 완성, 이름 관리 매크로)를 함께 제공해야 할 필요가 있다.

연구 제한점으로는 실험이 단순 합계 공식에 국한되었으며, 복잡한 함수나 다중 시트 연동 상황에서는 결과가 달라질 가능성이 있다. 또한, 참가자들이 모두 교육기관에 소속된 학생이므로 실제 기업 현장의 파워 유저와는 차이가 있을 수 있다. 향후 연구에서는 다양한 복합 함수, 실제 업무 데이터, 그리고 전문가 집단을 대상으로 범위 이름의 장·단점을 비교 분석할 필요가 있다.


댓글 및 학술 토론

Loading comments...

의견 남기기