눈에 띄는 존재의 생존: 위키피디아 삭제 논의에서 드러난 성별 불균형
초록
위키피디아의 기사 삭제(Articles for Deletion, AfD) 과정에서 여성 전기글이 남성보다 더 빠르게 삭제 후보가 되지만, 합의에 도달하는 데는 더 오래 걸린다. 또한 역사 인물에 대한 AfD는 삭제·통합·리다이렉트가 빈번히 일어나며, 여성 전기가 남성 전기로 리다이렉트·통합되는 비율이 현저히 높다. 연구진은 경쟁위험 생존 모델을 적용해 이러한 성별 차이를 통계적으로 검증하였다.
상세 분석
본 연구는 2001년 15 월 15일부터 2023년 11월 3일까지의 전 세계 영어 위키피디아 전기문서에 대한 AfD 로그를 전수 조사하고, 위키데이터에서 제공하는 성별 라벨(남·여)만을 사용해 이진 성별 변수를 정의하였다. 전기문서가 AfD에 노출되는 시점을 ‘명시적 후보(Nomination)’ 시점으로 설정하고, 이후 발생할 수 있는 네 가지 최종 상태—(1) 삭제, (2) 유지, (3) 리다이렉트·통합, (4) 논의 중단—를 경쟁위험(competing risks) 형태의 다중 상태 모델로 구현하였다. 주요 독립 변수로는 성별, 논의 규모(편집 횟수·댓글 수), 전기 대상의 살아있는 여부(생존 인물 vs. 사망 인물), 그리고 연도·주제 분야(과학·예술·정치 등)를 포함하였다. Cox 비례위험 모델과 Fine‑Gray 서브분포 위험 모델을 병행 적용해 성별이 각 위험에 미치는 영향을 추정했으며, 부트스트랩을 이용해 신뢰구간을 확보하였다. 결과는 다음과 같다. 첫째, 여성 전기문서는 남성보다 평균 23 % 빠르게 AfD 후보가 되며, 이는 HR = 1.23 (p < 0.01)로 통계적으로 유의했다. 둘째, 후보가 된 후 합의에 도달하는 평균 시간은 여성 > 남성(여성 = 12.4 일, 남성 = 9.1 일, HR = 0.73, p < 0.05)으로, 여성 전기가 더 오래 논의됨을 보여준다. 셋째, ‘리다이렉트·통합’ 위험이 여성에게서 남성보다 1.58배 높게 나타났으며, 특히 역사 인물(19 세기 이전)에서 이 현상이 두드러졌다. 마지막으로 논의 규모를 통제했음에도 성별 효과는 지속되었으며, 이는 단순히 토론량 차이에 의한 것이 아니라 구조적 편향이 존재함을 시사한다. 연구는 위키피디아의 ‘노터빌리티(notability)’ 기준이 성별에 따라 다르게 적용될 가능성을 제시하고, AI 학습 데이터로 활용되는 위키피디아가 성별 편향을 증폭시킬 위험을 경고한다.
댓글 및 학술 토론
Loading comments...
의견 남기기