와리쿠타 운동, 인터넷에서 힘을 측정한다
초록
본 연구는 구글 검색 결과의 페이지 수를 이용해 정규화 웹 거리(Normalized Web Distance, NWD)를 계산하고, 1994년부터 2013년까지 ‘Wirikuta’, ‘Huichol’, ‘Wixarika’ 등 핵심 용어와 긍정·부정·중립 수식어의 동시 출현 빈도를 시간별로 추적한다. 이를 통해 멕시코 원주민 위리쿠타 보호 운동의 온라인 인식 변화를 정량화하고, 사회적 임파워먼트의 흐름을 탐색한다.
상세 분석
이 논문은 사회운동을 디지털 공공영역에서 측정하려는 시도로, 기존의 정성적 분석을 메타데이터 기반 정량적 방법으로 전환한다는 점에서 의미가 크다. 핵심은 Cilibrasi와 Vitányi가 제안한 정규화 웹 거리(NWD) 개념을 시간적 차원에 적용한 것이다. NWD는 두 용어 u와 v가 각각 나타나는 페이지 수 n(u), n(v)와 동시에 나타나는 페이지 수 n(u AND v)를 이용해
NWD(u,v)= (max{ln n(u), ln n(v)} – ln n(u AND v)) / (ln N – min{ln n(u), ln n(v)})
라는 식으로 정의된다(N은 해당 연도 전체 페이지 수 추정치). 이 값은 0에 가까울수록 의미적으로 유사함을 나타낸다. 연구자는 매년 1월 1일부터 12월 31일까지의 구글 검색 히트 카운트를 수집해, ‘Wirikuta’, ‘Huichol’, ‘Wixarika’와 13개의 수식어(긍정 7개, 부정 5개, 중립 1개) 사이의 NWD 변화를 계산했다.
방법론상의 강점은 (1) 대규모 웹 데이터를 자동으로 활용해 인간 코딩 비용을 최소화하고, (2) 연도별 제한 검색을 통해 ‘나무링’ 형태의 시간적 층위를 만든 점이다. 그러나 한계도 명확히 제시한다. 구글 히트 카운트는 검색 엔진의 내부 알고리즘, 인덱싱 지연, 사용자 쿼리 변동 등에 따라 비선형적이고 불안정한 값을 제공한다. 저자는 동일 쿼리를 세 대의 컴퓨터에서 여러 차례 실행해 표준오차를 추정했지만, 여전히 단기 변동성(특히 2002‑2003년)과 장기 추세 사이의 구분이 모호하다. 또한 영어 중심의 검색어 선택은 스페인어·와시라카어 등 현지 언어 표현을 충분히 포착하지 못해 의미적 편향을 야기할 가능성이 있다.
결과적으로, ‘Wirikuta’, ‘Huichol’, ‘Wixarika’는 시간에 따라 서로의 NWD가 감소하며 의미적 클러스터링이 강화되는 경향을 보였으며, 이는 온라인 상에서 이들 용어가 동일한 사회적 맥락으로 인식되고 있음을 시사한다. 긍정적 수식어(‘sacred land’, ‘ancestors’)와의 NWD는 초기에는 낮았지만, 2008년 이후 ‘mines’와의 연관성이 점차 강화되어 부정적 이미지가 부각되는 양상을 발견했다. 특히 ‘ancestors’와의 거리 증가는 전통적 정체성 요소가 점차 주변화되고 있음을 암시한다.
이러한 발견은 NWD가 사회운동의 ‘임파워먼트’를 완전히 측정하기엔 아직 부족하지만, 온라인 담론의 구조적 변화를 포착하는 유용한 지표가 될 수 있음을 보여준다. 향후 연구에서는 다언어 쿼리, 보다 정교한 검색 엔진 API 활용, 그리고 실제 현장 인터뷰와의 삼각측정을 통해 메타데이터 기반 측정의 신뢰성을 강화할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기