코드 기반 특징 엔지니어링과 랜덤 포레스트를 활용한 브라질 대중음악 장르 예측
초록
본 연구는 브라질 대중음악 9개 장르의 코드 데이터를 웹스크래핑으로 수집하고, 화성학적 특성을 반영한 23개의 해석 가능한 변수를 설계하였다. 이 변수들을 이용해 랜덤 포레스트 모델을 학습시켜 장르 분류 정확도를 평가했으며, 코드 기반 특징과 Spotify API 메타데이터가 모두 장르 예측에 유의미함을 확인하였다.
상세 분석
이 논문은 브라질 대중음악 장르 분류라는 구체적 과제를 위해 기존의 오디오 기반 접근법이 아닌, 심볼릭 코드 데이터를 중심으로 연구를 전개한다. 데이터는 Cifraclub이라는 사용자 기여형 사이트에서 웹스크래핑으로 8 340곡, 106명 아티스트, 9개 장르에 대해 484 000개의 행을 확보했으며, 추가 메타데이터(발매 연도, 인기 지표)는 Spotify API를 통해 보강하였다. 가장 큰 공헌은 23개의 특징을 네 그룹(삼화음·사화음, 불협화음 사화음, 주요 전이, 기타)으로 손수 설계한 점이다. 예를 들어, ‘주요 전이 비율’은 곡 내에서 가장 흔한 코드 전이 3가지를 각각 차지하는 비율을 계산해, 단조롭거나 복잡한 화성 진행을 정량화한다. 또한 ‘Circle of Fifths 거리’와 ‘반음 거리’와 같은 음악 이론 기반 거리 척도를 도입해 코드 간 관계를 수치화하였다. 이러한 특징은 전통적인 원-핫 인코딩 방식보다 해석 가능성이 높으며, 장르별 화성적 경향을 직접 탐색할 수 있게 한다. 모델링 단계에서는 랜덤 포레스트를 주요 분류기로 선택했으며, 이는 다수의 결정 트리를 앙상블해 변수 중요도를 추정하고 과적합을 방지한다. 교차 검증 결과, 코드 기반 특징만 사용했을 때도 평균 정확도가 70% 이상으로 나타났으며, Spotify 메타데이터와 결합했을 때 정확도가 78%까지 상승했다. 변수 중요도 분석에서는 ‘주요 전이 비율’, ‘코드 종류 비율(마이너·세븐 등)’, ‘곡 길이(비중 없는 코드 수)’가 장르 구분에 큰 영향을 미치는 것으로 드러났다. 한계점으로는 데이터가 사용자 기여형 사이트에 의존해 품질이 일정하지 않을 수 있고, 장르 라벨이 주관적이라는 점을 들었다. 또한, 현재는 9개 장르에 국한돼 있어 다른 브라질 음악 스타일이나 국제 장르에 대한 일반화는 검증되지 않았다. 향후 연구에서는 멀티모달 데이터(오디오, 가사)와 딥러닝 기반 시퀀스 모델을 결합해 성능을 향상시키고, 코드 변형(전조, 변조)까지 포괄하는 더 정교한 특징 추출 방법을 모색할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기