동시 선거경쟁 감시: 마로프 기반 위험 제한 감사
초록
여러 선거경쟁을 하나의 감사 그룹으로 묶어 배치 표본을 무작위로 추출하고, 각 배치에 포함된 경쟁들의 마진 과대평가 비율을 최대값(MARROP)으로 결합한다. MARROP을 기준으로 위험 제한 감사를 설계하면, 개별 경쟁별 독립 감사를 수행할 때보다 전체 오류 발생 확률(가족 오류율)을 낮은 비용으로 통제할 수 있다. 특히 MARROP 상한에 비례해 배치를 선택하는 PPEB 샘플링이 효율성을 크게 높인다.
상세 분석
본 논문은 다수의 선거경쟁(레이스)이 동시에 진행되는 선거에서, 각각을 별도로 감사하는 전통적 방식의 비효율성을 지적한다. 기존 방법은 각 레이스마다 독립적인 위험 제한 감사(RLA)를 수행해 개별 오류율을 제한하지만, 이는 전체 오류가 발생할 확률, 즉 가족 오류율(FWER)을 충분히 낮추지 못한다. 저자들은 이를 해결하기 위해 “경쟁 간 최대 상대 과대평가(MARROP)”라는 새로운 통계량을 도입한다. MARROP은 선택된 배치 내 모든 레이스의 쌍별 마진(over‑statement) 비율 중 최댓값을 의미한다. 이 값이 사전 설정한 위험 한계(α)보다 작으면, 모든 레이스의 결과가 올바르다고 판단한다.
핵심 아이디어는 두 단계로 구성된다. 첫째, 배치 표본을 추출할 때 각 배치에 대한 MARROP 상한값을 계산하고, 이 상한에 비례해 추출 확률을 부여한다(PPEB, probability proportional to an error bound). 이렇게 하면 오류 가능성이 큰 배치가 더 자주 검토되어 전체 감사 효율이 극대화된다. 둘째, 표본에서 실제 발견된 MARROP을 누적해 검정 통계량을 업데이트한다. 누적값이 위험 한계에 도달하면 감사를 중단하고, 도달하지 못하면 전체 손수 검표(full hand count)를 수행한다.
수학적으로는 각 레이스 r의 실제 마진 m_r와 표본에서 관측된 과대평가 δ_{br} (배치 b, 레이스 r) 사이의 관계를 이용한다. 배치 b에 대한 MARROP은 (\max_r \frac{δ_{br}}{m_r}) 로 정의되며, 이 값의 상한을 사전에 계산해 추출 확률 w_b = (\frac{U_b}{\sum_{b’}U_{b’} }) 로 설정한다. 여기서 U_b는 배치 b의 MARROP 상한이다. 이 방식은 기존의 “오버스테이트 마진” 방식보다 더 보수적이면서도 표본 크기를 크게 줄일 수 있다.
또한 논문은 MARROP 기반 감사가 FWER를 직접 제어한다는 점을 강조한다. 전통적인 per‑comparison error rate(PCER) 접근법은 각 레이스마다 α를 할당해 전체 α가 누적되는 문제를 안고 있다. 반면 MARROP은 전체 집합을 하나의 가설 검정으로 취급해, 전체 오류 확률을 α 이하로 유지한다. 실험 결과는 가상의 선거 데이터와 실제 미국 지방 선거 데이터를 사용해, PPEB 샘플링이 단순 균등 샘플링에 비해 평균 표본 크기를 30~50% 감소시키며, 동일한 위험 수준을 유지함을 보여준다.
마지막으로 저자는 구현상의 고려사항을 제시한다. 배치 정의는 투표소·투표기·시간 구간 등 다양한 기준으로 할 수 있으며, MARROP 상한을 계산하기 위해서는 각 레이스의 최소 마진과 가능한 최대 과대평가를 사전에 파악해야 한다. 또한, 감사 과정에서 발견된 실제 과대평가는 즉시 누적 MARROP에 반영되어, 실시간으로 감사 종료 여부를 판단한다. 이러한 동적 업데이트는 감사 비용을 최소화하면서도 투명성을 확보한다.
댓글 및 학술 토론
Loading comments...
의견 남기기