도메인 지식이 스프레드시트 오류에 미치는 영향: 벽과 공 실험 분석

본 연구는 도메인‑프리 ‘Wall’ 과 도메인‑응용 ‘Ball’ 두 과제를 통해 셀 오류율(CER)과 전체 셀 오류율(OCER)을 비교한다. 11명의 대학생·교수 참가자를 대상으로 오류 유형(읽기‑가능성, 논리, 대수)과 태도·자신감을 조사한 결과, 도메인‑응용 과제에서 오류 비율이 현저히 높으며, 도메인 지식이 스프레드시트 오류 발생에 중요한 영향을 미침을 확인하였다.

저자: - Richard J. Irons, Faculty of Business, Law

이 논문은 스프레드시트 오류 연구에 도메인 지식의 영향을 탐구하기 위해 두 가지 과제, ‘Wall’ 과 ‘Ball’을 설계·실시하였다. Wall 과제는 Panko와 Sprauge(1998)의 기존 실험을 그대로 재현한 것으로, 단순히 직육면체 벽을 건설하기 위한 재료·노동 비용을 계산하도록 요구한다. 필요한 수학적 지식은 기본 산술과 부피 계산 정도이며, 이는 대부분의 고등학교 교육 과정에서 다루는 수준이다. 반면 Ball 과제는 구형 부피·표면적 계산과 보일러의 법칙(압력·부피 관계)을 적용해야 하는 복합 문제로, 선형대수와 물리‑화학 개념을 요구한다. 두 과제 모두 스프레드시트 파일을 제출하도록 하였으며, 텍스트·제목·주석 셀까지 포함한 전체 셀을 대상으로 오류를 검토하였다. 연구자는 11명의 자원봉사자를 모집했으며, 이들은 전공이 다른 대학생(총 5명)과 학부·연구직 교원(6명)으로 구성되었다. 참여율이 낮아 모집 과정에서 큰 어려움을 겪었고, 인센티브 부재가 자발적 참여를 저해했다는 점을 논문에서 언급한다. 각 참가자는 과제를 자신의 일정에 맞춰 수행했으며, 과제 수행 시간은 1주에서 20주까지 크게 차이났다. 과제 완료 후 연구자는 스프레드시트를 검토하고, 오류를 세 가지 범주(읽기‑가능성, 논리, 대수)로 분류하였다. 오류 측정 지표는 두 가지가 사용되었다. 첫 번째는 전통적인 셀 오류율(CER)로, 계산 셀에 한정된 오류 비율을 산출한다. 두 번째는 전체 셀 오류율(OCER)로, 텍스트·제목·주석 셀을 포함한 모든 셀을 대상으로 오류를 계산한다. OCER 도입은 텍스트 셀의 오류가 의사결정에 미치는 잠재적 영향을 반영하려는 의도이다. 실험 결과는 다음과 같다. Wall 과제에서는 11명 중 9명이 하단값(bottom line)을 정확히 도출했으며, 오류가 있는 스프레드시트 비율은 18.18%에 그쳤다. 반면 Ball 과제에서는 정확한 하단값을 도출한 참가자는 2명에 불과했고, 오류가 있는 스프레드시트 비율은 71.42%로 크게 상승했다. 특히 대수 오류가 전체 오류의 대부분을 차지했으며, 읽기‑가능성 오류도 도메인‑응용 과제에서 더 빈번히 나타났다. 정성적 인터뷰에서는 참가자들이 자신의 스프레드시트에 대한 자신감을 과대평가하는 경향이 드러났다. 이는 기존 연구(Brown & Gould, 1987)와 일치하며, 오류 인식 부족이 오류 수정 가능성을 낮춘다. 또한 도메인 지식이 부족한 경우 ‘if‑statement’와 같은 기본 방어 로직을 누락하는 사례가 관찰되었다. 예시로는 Benninga 교재의 재무 모델에서 세금·배당을 음수 소득에 대해 계산하는 오류가 제시되었으며, 이는 도메인 지식 결여가 직접적인 오류 원인임을 보여준다. 오류 분류 체계에 대한 논의에서는 Panko와 Halverson(1997)의 기계·논리·생략 분류와 Rajalingham 등(2001)의 복합 트리 구조를 검토했지만, 현재 연구의 목적과 표본 규모에 맞추어 세 가지 대분류만을 채택했다. 이는 실용성을 높이고, 오류 유형 간 비교를 용이하게 한다. 연구는 몇 가지 제한점을 인정한다. 첫째, 표본 크기가 작고, 참여자들이 대학생·교수라는 제한된 인구통계학적 특성을 가지고 있다. 둘째, 과제 수행 기간이 크게 달라 시간적 변수 통제가 어려웠다. 셋째, 인센티브 부재와 자발적 참여 방식이 선택 편향을 초래했을 가능성이 있다. 이러한 제한에도 불구하고, 연구는 도메인 지식이 스프레드시트 오류 발생에 중요한 영향을 미친다는 실증적 증거를 제공한다. 결론적으로, 단순 계산 과제에서는 오류율이 낮지만, 실제 비즈니스 상황에서 요구되는 복합 도메인 지식이 결합될 때 오류 위험이 급격히 상승한다. 따라서 스프레드시트 교육·훈련 프로그램은 도메인 지식과 스프레드시트 설계 원칙을 동시에 강화해야 하며, 오류 방지를 위한 자동화 도구도 도메인‑특화 로직 검증을 포함하도록 설계되어야 한다. 향후 연구는 더 큰 표본과 다양한 도메인을 포함해 오류 발생 메커니즘을 심층적으로 탐구하고, 실시간 오류 탐지 및 교정 지원 시스템을 개발하는 방향으로 진행될 필요가 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기