유튜브 영상 주목도와 인기의 엔트로피 분석

유튜브 영상 주목도와 인기의 엔트로피 분석

초록

본 논문은 유튜브 “Trending”과 “Most recent” 피드의 영상들을 대상으로, 조회수·좋아요·댓글 등 인기 지표의 시간별 분포에 엔트로피를 적용해 주목도의 불확실성을 정량화한다. “Most recent” 영상 중 약 20%가 “Trending” 영상과 유사한 엔트로피 특성을 보이며, 이들와 나머지 80% 사이의 차이를 분석해 인기 형성 메커니즘을 제시한다.

상세 분석

연구자는 2016년~2017년 사이에 YouTube API를 통해 두 피드에서 각각 5,000개 이상의 영상을 수집하고, 24시간 간격으로 30일 동안 조회수, 좋아요, 댓글 수를 기록하였다. 각 지표의 시계열을 확률분포로 정규화한 뒤, Shannon 엔트로피 H=−∑p_i log p_i 를 계산해 시간에 따른 불확실성 변화를 추적한다. “Trending” 영상은 초기 단계부터 높은 조회수 증가율과 낮은 엔트로피(즉, 주목이 집중된 상태)를 보이며, 급격한 엔트로피 감소 후 안정화되는 패턴을 나타낸다. 반면 “Most recent” 영상은 대부분 엔트로피가 높고 변동성이 커서 주목이 분산된 상태이다. 그러나 전체의 20%에 해당하는 영상은 초기 엔트로피가 낮고, 이후 급격히 감소하는 궤적을 보여 “Trending” 영상과 유사한 성장 곡선을 가진다. 저자는 이 집단을 “잠재적 인기 영상”이라 정의하고, 엔트로피 감소 속도와 절대값을 기준으로 세부 서브그룹(초고속 성장, 완만 성장, 정체)으로 나누었다. 통계적 검증으로는 Kolmogorov‑Smirnov 검정과 클러스터링(k‑means) 분석을 활용했으며, 엔트로피가 낮은 초기 단계가 향후 높은 누적 조회수와 강한 상관관계를 갖는 것을 확인하였다. 또한, 댓글과 좋아요의 엔트로피는 조회수 엔트로피와 상호 보완적으로 작용해, 멀티모달 엔트로피 통합 모델이 단일 지표보다 예측 정확도가 12% 향상됨을 보고한다. 이러한 결과는 플랫폼 운영자가 초기 신호만으로도 잠재적 히트 영상을 선별하고, 추천 알고리즘에 엔트로피 기반 가중치를 적용할 수 있음을 시사한다.