현대 서양 대중음악의 복잡성 진화와 인기 메커니즘
Million Song Dataset을 활용해 1960‑2010년 사이 서양 대중음악의 피치·음색·음량·리듬 복잡성을 정보이론적 조건부 엔트로피로 측정했다. 인기 차트인 Billboard Hot 100에 오른 곡들은 전체 곡에 비해 복잡도가 평균에 가깝고 분산이 작아 ‘중간 복잡도가 가장 인기’를 뒷받침한다. 시대별로는 음량 복잡도가 감소하고, 음색 복잡도가 전체적으로 상승했지만 Hot 100에서는 정체된 모습을 보인다. 피치·리듬 유사도는 크…
저자: Thomas Parmer, Yong-Yeol Ahn
본 연구는 1960년부터 2010년까지 서양 대중음악의 복잡성이 어떻게 변천했는지를 대규모 데이터셋인 Million Song Dataset(MSD)을 기반으로 분석한다. 저자들은 먼저 데이터 전처리를 통해 중복곡, 메타데이터 결손곡, 인터뷰·코멘터리 등 비음악 콘텐츠를 제외하고 905,896곡을 확보하였다. 각 곡은 시간 세그먼트별로 피치, 음색, 음량, 리듬 정보를 포함하는 ‘코드워드’로 변환된다. 피치와 음색 코드는 각각 12개의 반음 존재 여부와 11개의 음색 성분을 3단계로 이산화한 벡터이며, 음량 코드는 세그먼트의 최대 데시벨을 구간화, 리듬 코드는 평균 16분음표 간격을 기반으로 정의된다.
복잡성은 코드워드 간의 조건부 엔트로피 H(Y|X)로 측정한다. 이는 현재 코드워드 Y가 이전 코드워드 X에 의해 얼마나 예측 가능한지를 나타내며, 음악 청취 시 기대와 놀라움의 심리학적 메커니즘을 반영한다는 이론적 배경을 가진다. 각 곡에 대해 네 차원(피치, 음색, 음량, 리듬) 각각의 엔트로피 값을 계산하고, 이를 통해 복잡도 분포와 평균값을 도출한다.
다음으로 인기와 복잡성의 관계를 탐구한다. Billboard Hot 100에 오른 6,661곡을 ‘인기곡’으로 정의하고, 전체 곡 집합에서 무작위로 추출한 1,000개의 부트스트랩 샘플과 비교한다. 결과는 인기곡이 전체 곡에 비해 피치와 음색 복잡도는 평균보다 낮고, 음량 복잡도는 평균보다 높으며, 전반적인 복잡도 분포가 평균에 더 가깝고 분산이 작다는 점을 보여준다. 이는 복잡도가 너무 낮거나 높을 경우 청취자 만족도가 떨어지고, 중간 정도 복잡도가 가장 큰 쾌감을 제공한다는 ‘역U형’ 가설을 대규모 데이터 수준에서 실증한다.
시대별 복잡성 변화를 살펴보면, 전체 데이터에서는 음량 복잡도가 지속적으로 감소하고(‘loudness war’와 저음량 장르 부상 가능성), 음색 복잡도는 1990년대까지 꾸준히 상승 후 plateau에 도달한다. 리듬 복잡도는 1964‑1983년 사이 감소 후 안정화하고, 피치 복잡도는 큰 변동 없이 유지된다. 반면 Hot 100 곡들은 음색 복잡도가 거의 변하지 않아, 새로운 고음색 복잡도 장르가 주류 차트에 크게 침투하지 않았음을 시사한다. 또한, 최근에는 인기곡이 피치·음량·리듬 복잡도는 상승하고 음색 복잡도는 정체된 경향을 보인다.
곡 간 유사도는 같은 연도 Hot 100 곡들 사이의 Kullback‑Leibler(KL) 발산으로 측정했다. KL 발산이 클수록 코드워드 분포가 서로 다름을 의미한다. 분석 결과, 피치와 리듬에서는 연도별 KL 발산이 크게 변하지 않아 유사도가 일정함을 보여준다. 음색은 1983‑1991년 사이에 일시적으로 유사도가 감소했다가 다시 회복했으며, 음량은 전반적으로 KL 발산이 감소해 차트 곡들이 점점 비슷해지고 있음을 나타낸다.
장르별 복잡성 프로파일도 상세히 조사하였다. 장르는 아티스트 레벨의 Echo Nest 태그를 사용해 할당했으며, 주요 장르(전자·댄스, 재즈, 힙합, 헤비메탈 등)의 평균 복잡도 값을 비교했다. 전자·댄스 장르는 높은 피치·음색 복잡도와 낮은 리듬 복잡도를, 재즈는 높은 리듬·음량 복잡도를, 힙합은 높은 피치·음량 복잡도를, 헤비메탈은 높은 리듬 복잡도와 낮은 피치·음량 복잡도를 보였다. 이러한 차이는 청취자 선호와 장르 특성 간의 트레이드오프를 반영한다는 해석이 가능하다.
연구의 한계로는 복잡성 측정이 조건부 엔트로피 하나에 의존한다는 점, MSD 메타데이터와 장르 라벨링의 정확도 문제, 초기 연도(1960‑1970) 데이터 부족으로 인한 샘플 편향, 그리고 ‘인기’를 차트 진입으로만 정의한 점 등을 들 수 있다. 또한, 청취자 주관적 만족도와의 직접적인 연결 고리가 부족하므로, 향후 설문·뇌파 데이터와 결합한 연구가 필요하다.
결론적으로, 이 논문은 대규모 음악 데이터와 정보이론적 접근을 통해 복잡성‑인기 관계, 시대별 복잡성 변천, 장르별 특성 등을 정량화했으며, 음악 추천 시스템, 자동 작곡, 문화 진화 모델링 등에 활용 가능한 중요한 통찰을 제공한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기