전문가 순위와 검색엔진 결과의 상관관계 탐구
초록
전문가가 선정한 실물 대상 순위와 해당 대상의 웹사이트가 검색엔진에서 차지하는 순위 사이에 통계적 연관성이 있는지를 9개의 실험을 통해 조사하였다. 구글·라이브·야후 3개 검색엔진과 10·25·50개의 리스트 길이에서 비교했지만, 강한 상관관계는 거의 발견되지 않았으며, 리스트가 커질수록 상관도가 감소하는 경향을 보였다.
상세 분석
본 연구는 “전문가 순위와 검색엔진 순위 사이에 실질적인 연관성이 존재하는가”라는 질문에 답하기 위해 설계되었다. 먼저, 미국 뉴스 앤 월드 리포트, USNWR, US News 등에서 발표한 8개의 권위 있는 전문가 순위(비즈니스 스쿨, 대학, 스포츠 팀, 기업 가치 등)를 선정하고, 각 순위에 해당하는 실체의 공식 웹사이트 URL을 수집하였다. 이후 구글, 마이크로소프트 라이브 서치(구 MSN), 야후 3개의 주요 검색엔진에 동일한 키워드(대개는 기관명)를 입력해 검색 결과 상위 10, 25, 50개의 순위를 추출하였다.
통계적 검증은 순위 간 상관관계를 측정하기 위해 스피어만의 ρ와 켄달의 τ를 사용했으며, p‑값이 0.05 이하인 경우를 통계적으로 유의미한 상관관계로 간주하였다. 총 57개의 전문가‑검색엔진 비교 중 강한 상관관계(ρ≥0.7)는 1건, 중간 정도 상관관계(0.5≤ρ<0.7)는 4건만이 유의미하게 나타났다. 반면, 검색엔진 간 자체 비교(42건)에서는 강한 상관관계가 2건, 중간 상관관계가 4건 발견되었다.
특히 리스트 길이가 짧을수록(10위) 강한 상관관계가 나타날 확률이 높았으며, 25위에서는 중간 상관관계가 주로 관찰되었고, 50위에서는 거의 상관관계가 없었다. 이는 검색엔진이 상위 몇 개 결과에 대해서는 전문가 의견과 어느 정도 일치시키려는 알고리즘적 최적화를 수행하지만, 리스트가 길어질수록 다양한 외부 요인(링크 구조, SEO, 최신성 등)이 개입해 일관성을 잃는 것으로 해석될 수 있다.
연구의 한계로는 URL 매핑 과정에서 동일 기관이라도 여러 도메인이 존재할 수 있어 순위 측정에 오차가 발생했을 가능성, 검색엔진의 개인화 및 지역별 결과 차이, 그리고 전문가 순위 자체가 주관적 평가에 기반한다는 점을 들 수 있다. 또한, 단일 시점(2010년대 초중반)의 데이터에 국한되어 있어 시간에 따른 변동성을 반영하지 못한다.
결론적으로, 전문가가 매긴 실물 순위와 검색엔진이 제공하는 웹 순위 사이에는 제한적인 연관성만 존재한다는 것이 확인되었다. 이는 검색엔진 최적화(SEO) 전략이 전문가 평판과 직접적인 상관관계를 보장하지 않으며, 사용자에게 제공되는 정보의 신뢰성을 판단할 때 전문가 의견과 검색 결과를 별도로 고려해야 함을 시사한다.