음악 스트리밍 사용자의 스킵 행동과 곡 구조의 숨은 연관성
본 연구는 스트리밍 서비스에서 사용자가 곡을 중간에 멈추고 다른 곡으로 넘어가는 “스킵” 시점을 시간축상에 분석한다. 스킵 발생 패턴이 곡마다 고유하며, 사용자 집단·시간·지역에 관계없이 일관됨을 확인하였다. 특히 스킵 빈도가 곡의 구조적 전환(인트로·벌스·코러스 등) 직후에 급증한다는 상관관계를 발견했고, 이를 활용해 대규모 청취 데이터만으로 곡 구조를 예측하는 모델을 학습시켰다. 기존의 소규모 라벨 데이터 기반 방법보다 현저히 높은 정확도를…
저자: Nicola Montecchio, Pierre Roy, Franc{c}ois Pachet
본 논문은 스트리밍 서비스 이용자의 ‘스킵’ 행동을 시간축상에서 정량적으로 분석하고, 그 패턴이 음악 구조와 어떻게 연관되는지를 탐구한다. 연구는 크게 네 부분으로 구성된다.
1. **데이터 수집 및 전처리**
- 2018년 4~5월에 발매된 인기곡 100곡을 대상으로, 2018년 8월부터 3개월간 전 세계 Spotify 이용자의 스트리밍 로그를 수집했다.
- 총 30억 건 이상의 스킵 이벤트와 3억 건 이상의 전체 재생 이벤트를 확보했으며, 각 곡의 첫 2분 구간을 정규화하고 초기 5초는 청취 초기 적응 현상으로 제외했다.
- 스킵 확률을 시간에 따라 히스토그램 형태로 나타낸 ‘Skip Profile’를 구축하였다.
2. **스킵 프로파일의 고유성 및 일관성 검증**
- 동일 곡에 대한 서로 다른 날짜의 Skip Profile 간 유클리드 거리를 계산한 결과, 같은 곡 내 거리와 다른 곡 간 거리가 명확히 구분됨을 확인했다.
- 정보 검색 관점에서 Mean Average Precision(MAP)를 사용해 곡 식별 실험을 수행했으며, 무작위 기준 MAP 0.014에 비해 0.886이라는 높은 점수를 얻었다. 이는 스킵 패턴이 곡마다 고유한 ‘청취 서명’임을 의미한다.
- 시간적 변동성을 살펴본 결과, 스트리밍 양이 급격히 변하는 경우를 제외하고는 첫 2주 이후 Skip Profile가 크게 변하지 않았다. 또한, 미국·영국·멕시코·독일 등 주요 국가별로도 프로파일이 거의 동일했으며, MAP 0.939를 기록했다.
3. **스킵 행동과 음악 구조의 상관관계**
- 곡의 구조적 경계(인트로·벌스·코러스·브릿지 등)와 Skip Profile를 겹쳐 시각화한 결과, 섹션 전환 직후 스킵 확률이 급증하는 패턴이 반복적으로 나타났다.
- 통계적으로는 전환 구간 전후 2초 내 스킵 비율 차이가 95% 신뢰구간에서 유의미했으며, 이는 청취자가 새로운 음악적 아이디어를 인지하고 즉시 반응한다는 가설을 뒷받침한다.
4. **스킵 데이터를 활용한 구조 예측 모델**
- 기존 구조 세분화 연구는 라벨이 제한된 소규모 데이터에 의존했으며, 주로 멜 스펙트럼, 하모니, 리듬 등 오디오 특징을 사용했다.
- 본 연구는 스킵 이벤트를 ‘반자동 라벨’로 활용해 대규모 학습 데이터를 자동 생성하였다. 이를 바탕으로 CNN‑RNN 하이브리드 모델을 학습시켰으며, SALAMI 데이터셋 기반 베이스라인과 비교했을 때 구조 경계 검출 정확도가 평균 12%p 상승했다. 특히 전자음악(드롭 구간)에서 큰 개선을 보였다.
- 모델 평가에서는 Precision, Recall, F1-score 모두 기존 방법을 능가했으며, 라벨링 비용을 크게 절감할 수 있음을 입증했다.
**결론 및 시사점**
- 스킵 프로파일은 곡 고유의 청취 서명이며, 시간·지역에 크게 의존하지 않는다.
- 스킵 행동은 음악적 구조 전환과 강한 연관성을 가지며, 이를 통해 사용자의 인지적 반응을 정량화할 수 있다.
- 대규모 청취 로그를 활용한 반지도학습은 기존의 소규모 라벨 데이터 기반 방법보다 뛰어난 성능을 보이며, 음악 정보 검색, 개인화 추천, 작곡 지원 도구 등에 적용 가능하다.
본 연구는 음악 청취 행동을 데이터 과학적으로 해석함으로써, 음악학·인지과학·AI 기술이 융합된 새로운 연구 패러다임을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기