스프레드시트 오류가 미치는 실제 영향 분석
본 연구는 5개 조직의 운영 스프레드시트 25개를 대상으로 감사 프로토콜을 적용해 오류를 식별하고, 각 오류가 실제 결과값에 미치는 정량적 영향을 측정하였다. 오류 117건 중 70건이 비제로 영향을 보였으며, 대부분은 영향이 미미하거나 중요하지 않은 영역에 국한되었다. 그러나 일부 오류는 1억 달러 이상이라는 큰 절대적 손실을 초래하였다. 조직별 스프레드시트 품질은 크게 차이났으며, 오류와 품질 사이에 명확한 상관관계는 발견되지 않았다.
저자: Stephen G. Powell, Barry Lawson, Kenneth R. Baker
본 논문은 운영 중인 스프레드시트에 존재하는 오류와 그 정량적 영향을 최초로 체계적으로 조사한 연구이다. 서론에서는 기존 문헌이 오류의 존재는 확인했지만, 오류 유형·원인·영향에 대한 구체적 데이터가 부족함을 지적한다. 연구 목표는 실제 업무에 사용되는 스프레드시트를 대상으로 오류를 식별하고, 오류 수정이 결과값에 미치는 절대·상대적 변화를 측정함으로써 오류의 실질적 위험성을 평가하는 것이다.
연구 설계는 크게 세 단계로 구성된다. 첫째, 5개 조직(컨설팅 2곳, 금융 서비스, 제조, 대학)에서 자발적으로 5명씩, 총 25명의 스프레드시트 개발자를 모집하였다. 각 개발자는 3~10개의 워크시트, 250~10,000개의 수식, 200~1,000KB 크기 등 사전 정의된 기준을 충족하도록 요청받았지만, 실제 샘플은 평균 15.2시트, 1,463KB 등 기준을 초과하는 경우가 많았다. 이는 실제 현장의 스프레드시트가 다양하고 복잡함을 보여준다.
둘째, 감사 프로토콜을 적용하였다. 프로토콜은 이전 연구에서 개발된 상세 매뉴얼로, 스프레드시트의 크기·복잡도·정성적 특징·오류 탐지를 단계별로 수행한다. 감사자는 먼저 개발자가 제공한 설문을 검토하고, ‘Spreadsheet Professional’ 도구를 이용해 잠재적 오류 지점을 시각화하였다. 이후 각 시트를 직접 검토하며, 모든 고유 수식과 복사된 수식을 검사하고, 의심되는 셀·범위에 대해 위치, 오류 유형, 발견 방법, 설명을 기록하였다.
셋째, 개발자와 인터뷰를 통해 각 이슈를 ‘오류’, ‘불량 관행’, ‘오류 아님’으로 분류하고, 실제 오류인 경우 해당 셀을 수정한 뒤 핵심 출력 셀의 값을 비교해 정량적 영향을 측정하였다. 영향 측정은 절대값(예: 달러)과 상대값(퍼센트) 두 가지로 기록했으며, 오류가 여러 셀에 걸쳐 있거나 종속 셀이 다수인 경우 가장 중요한 종속 셀을 선택해 평가하였다.
오류 유형은 논문에서 정의한 6가지로 구분하였다. 논리 오류는 수식 자체가 잘못된 경우, 참조 오류는 잘못된 셀을 참조하는 경우, 하드코딩은 상수를 직접 삽입한 경우, 복사·붙여넣기 오류는 복제 과정에서 발생한 오류, 데이터 입력 오류는 잘못된 입력값, 누락 오류는 빈 입력 셀을 의미한다. 하드코딩은 대부분을 불량 관행으로 처리했으며, 실제 오류로 인정된 경우는 제한적이었다.
연구 결과는 다음과 같다. 총 381개의 이슈가 발견됐으며, 이 중 117건이 오류로 확인되었다. 9개의 스프레드시트는 오류가 전혀 없었고, 나머지 16개에서는 평균 7.3건(최대 44건)의 오류가 발견되었다. 117건 중 47건은 수정해도 결과값이 변하지 않아 영향이 0%였으며, 이는 오류가 동일한 값을 참조하거나 결과에 사용되지 않은 셀에 국한된 경우였다. 비제로 영향을 가진 오류는 70건으로, 이 중 12건은 평균 22%의 상대적 변화를 보였고, 24건은 절대값이 $10,000 이하였다. 가장 큰 절대 오류는 $100,000,000을 초과했으며, 이는 일부 조직에서 스프레드시트가 핵심 재무 의사결정에 직접 사용된다는 위험성을 강조한다.
조직별 분석에서는 차이가 두드러졌다. 조직 5(소규모 컨설팅)는 5개의 이슈 중 오류가 전혀 없었으며, 스프레드시트 품질이 매우 높았다. 조직 4는 오류 없는 스프레드시트와 44건의 오류가 있는 스프레드시트가 공존하는 등 내부 품질 격차가 컸다. 조직 3(다른 컨설팅)에서는 모든 스프레드시트에 오류가 있었지만, 대부분은 영향이 없거나 미미했다. 대규모 금융 조직(조직 1)과 제조 조직(조직 2)은 오류 빈도와 규모가 가장 높았으며, 복잡한 모델과 대량 데이터 처리 때문에 오류 관리가 어려웠다.
논의에서는 스프레드시트 오류가 반드시 큰 손실을 초래하는 것은 아니며, 대부분은 ‘양성 오류’로 분류돼 실질적 위험이 낮다는 점을 강조한다. 그러나 일부 오류는 막대한 금전적 손실을 야기할 수 있으므로, 조직 차원의 표준화·감사·교육이 필요함을 제언한다. 또한 스프레드시트가 수천 개의 결과를 산출하는 경우가 많아, 핵심 출력 셀을 정의하고 오류 영향을 측정하는 것이 어려운 현실을 지적한다.
결론적으로, 스프레드시트 오류는 조직마다 크게 다르며, 오류와 스프레드시트 중요도 사이에 명확한 상관관계가 없음을 발견했다. 오류가 없는 ‘완벽한’ 스프레드시트는 존재하지만, 대부분은 일부 오류가 존재하더라도 실질적 영향이 제한적이다. 따라서 기업은 오류 감지를 위한 체계적인 감사 프로토콜을 도입하고, 오류 유형별 위험도를 평가해 고위험 영역에 집중적인 검증을 수행함으로써 비용 효율적인 위험 관리가 가능하다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기