보수적 사후 선거 감사: 순차 검정과 신뢰 구간

이 논문은 보고된 투표 결과와 실제 투표 사이의 차이를 검증하기 위해, 표본 추출된 일부 투표구를 손으로 재검표하고, 그 오차를 이용해 “전체 재검표 시 결과가 바뀔 가능성”을 가설 검정하는 보수적 순차 검정 절차를 제시한다. 사전에 정의된 각 투표구별 오버스테이트 한계값을 활용해 오류 누적을 제한하고, 지정된 유의수준 α 이하로 잘못된 결과를 확정할 위험을 제어한다. 실제 2006년 미네소타 상원의원 선거와 캘리포니아 소규모 교육 위원회 선거…

저자: Philip B. Stark

이 논문은 선거 결과의 정확성을 검증하기 위한 통계적 사후 감사 방법을 제안한다. 선거에서 발생할 수 있는 다양한 오류—인적 실수, 기계 오류, 고의적 부정 등—를 고려하여, 보고된 투표 결과와 실제 투표 사이의 차이를 정량화하고, 이를 바탕으로 “전체 수작업 재검표 시 결과가 바뀔 가능성”을 가설 검정한다. 핵심 아이디어는 각 투표구(p)에 대해 사전에 정의된 오버스테이트 한계 eₚ (즉, 해당 구에서 마진을 최대 얼마만큼 증가시킬 수 있는지) 를 설정하고, 표본 추출된 구들의 손검표 결과를 통해 실제 오류 dₚ 를 측정한다. 오류가 마진에 미치는 영향을 가중함수 wₚ(dₚ) 로 변환하여 누적 가중 오류 Wₛ =∑_{p∈Jₛ} wₚ(dₚ) 를 계산한다. 여기서 Jₛ 는 단계 s 에서 선택된 구들의 집합이다. 검정 절차는 순차적이다. 초기 단계에서는 사전에 정해진 표본 크기 n₁ (예: 전체 구의 1 %)를 무작위(또는 층화)로 선택하고 손검표한다. 관측된 W₁ 이 사전에 설정된 임계값 c₁ (α 수준과 전체 오류 한계 E에 기반)보다 크면 귀무가설을 기각하고, 보고된 결과가 실제와 동일함을 선언한다. 그렇지 않으면 추가 표본 n₂ 을 추출해 단계 s+1 으로 진행한다. 이 과정은 모든 구를 검토하거나 귀무가설이 기각될 때까지 반복된다. 임계값 cₛ 은 보수적으로 설정된다. 전체 오류 한계 E =∑ₚ eₚ 와 선택된 유의수준 α 를 이용해, “오류 누적이 E 를 초과할 확률”이 α 이하가 되도록 보장한다. 따라서 절차가 결과를 확정했을 때, 실제 전체 재검표 결과가 다를 확률은 α 보다 크지 않다. 이는 선거 관리자가 “오류가 있을 가능성을 1 % 이하로 제한하고 결과를 확정하고 싶다”는 요구를 충족한다. 또한, 고정된 표본 크기에서 관측된 오류에 대해 보수적인 P‑값을 제공한다. 관측된 Wₛ 값에 대해 P = sup_{θ∈H₀} P_θ(Wₛ≥observed) 을 계산함으로써, 현재 표본만으로도 결과가 신뢰할 만한지 정량적으로 판단할 수 있다. 이는 기존 방법이 제공하지 못한 “부분 감사만으로도 통계적 신뢰도 제공”이라는 장점을 갖는다. 오류 한계 eₚ 는 보고된 투표수 vₚ 와 해당 구의 최대 투표 가능 수 bₚ (예: 등록 유권자 수, 기계가 처리할 수 있는 최대 표수) 로부터 도출된다. 구체적으로 eₚ = min{bₚ−vₚ, vₚ−aₚ 등} 형태로 정의해, 과대계산(overstatement)과 과소계산(understatement) 모두를 포괄한다. 이는 투표기 종류(전자식, 종이식)나 구 규모에 따라 서로 다른 한계를 적용할 수 있게 해, 현장 실무에서 유연성을 제공한다. 논문은 두 실제 사례를 통해 방법론을 검증한다. 첫 번째는 2006년 미네소타 주 상원의원 선거이며, 두 번째는 캘리포니아 사우살리토 마린 시티 교육 위원회 선거이다. 미네소타 사례에서는 전체 구가 약 2,000여 개였으며, 1 % 표본(≈20구)만으로도 마진이 충분히 커서 W₁ 이 임계값을 초과했다. 따라서 추가 감사 없이 바로 결과를 확정할 수 있었다. 이는 큰 마진과 비교적 균일한 구 규모가 감사 효율을 크게 높인 사례이다. 반면 캘리포니아 사례는 소규모 선거(투표구 수가 적고, 각 구당 투표 수 차이가 크게 변동)였으며, 초기 1 % 표본(1~2구)에서는 W₁ 이 임계값 이하였다. 따라서 단계 2 와 3 에서 각각 표본을 확대해 총 5~6구를 검토했으며, 최종적으로 W₃ 이 임계값을 초과해 결과를 확정했다. 이 과정에서 각 구의 eₚ 값이 크게 달라 보수적인 가중 함수 wₚ 를 적용함으로써, 작은 구에서 발생한 작은 오류가 전체 마진에 미치는 영향을 적절히 반영했다. 논문은 또한 기존의 “고정 비율(예: 1 %) 샘플링”이 제공하지 못하는 점을 비판한다. 고정 비율은 마진이 작거나 구 규모가 큰 경우 충분한 신뢰도를 보장하지 못한다는 것이며, 제안된 순차 검정은 마진, 구 수, 구당 투표수 등을 모두 고려해 동적으로 표본 크기를 결정한다. 결론적으로, 이 연구는 “오류 상한 기반 보수적 순차 검정”이라는 새로운 프레임워크를 제시함으로써, 선거 감사가 통계적 신뢰도를 명확히 제공하고, 필요한 경우 최소한의 추가 표본으로 결과를 확정하거나 전체 재검표로 전환할 수 있게 한다. 이는 선거 투명성 강화와 감사 비용 절감이라는 두 목표를 동시에 달성할 수 있는 실용적인 방법이다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기