플라멩코 가창의 멜로디 윤곽과 중간 수준 특징 분석

본 연구는 플라멩코 전통 가창인 데블라와 마르티네테의 멜로디 유사성을 자동 전사와 전문가가 정의한 중간 수준 특징을 결합해 측정한다. 최신 자동 전사 알고리즘으로 음높이와 리듬을 추출하고, 플라멩코 전문가가 라인별 멜로디 구간, 장식음, 음정 변동 등을 라벨링한다. 두 데이터는 가중합으로 통합된 유사도 행렬을 만들고, 계통수(phylogenetic) 클러스

플라멩코 가창의 멜로디 윤곽과 중간 수준 특징 분석

초록

본 연구는 플라멩코 전통 가창인 데블라와 마르티네테의 멜로디 유사성을 자동 전사와 전문가가 정의한 중간 수준 특징을 결합해 측정한다. 최신 자동 전사 알고리즘으로 음높이와 리듬을 추출하고, 플라멩코 전문가가 라인별 멜로디 구간, 장식음, 음정 변동 등을 라벨링한다. 두 데이터는 가중합으로 통합된 유사도 행렬을 만들고, 계통수(phylogenetic) 클러스터링을 통해 스타일 구분과의 일치도를 검증한다. 결과는 자동 전사만으로는 포착하기 어려운 전통적 뉘앙스를 전문가 라벨이 보완함을 보여준다.

상세 요약

이 논문은 전통 음악 분석에서 ‘자동화’와 ‘전문가 지식’의 상호 보완성을 실증적으로 입증한다는 점에서 학술적 의의가 크다. 먼저, 저자들은 최신 딥러닝 기반 자동 멜로디 전사 시스템을 플라멩코 녹음에 적용했는데, 이는 비정형적인 음성 신호와 자유로운 리듬 구조를 가진 플라멩코에 대한 전사 정확도를 기존 방법보다 현저히 향상시킨다. 전사 결과는 피치 시퀀스와 음절 경계 정보를 제공하며, 이를 기반으로 유클리드 거리와 DTW(Dynamic Time Warping) 같은 시계열 유사도 측정이 가능해진다. 그러나 전사만으로는 플라멩코 특유의 ‘멜로디 윤곽’—예를 들어, 특정 구간에서의 급격한 음정 상승, 장식음의 밀도, 그리고 전통적으로 강조되는 ‘플라멩코 스케일’(Phrygian mode)의 사용—을 충분히 포착하지 못한다. 이를 보완하기 위해 연구팀은 플라멩코 전문가 5인이 12개의 중간 수준 멜로디 특징을 정의하고 라벨링하였다. 여기에는 ‘시작 음정’, ‘중간 구간의 음정 변동 폭’, ‘장식음 종류와 빈도’, ‘구조적 구간 구분(코러스·버스 등)’, ‘리듬적 강조점’ 등이 포함된다. 이러한 라벨은 정량적 변수로 변환돼 전사 기반 피치 시퀀스와 결합된다. 결합 방법은 두 유사도 행렬을 가중 평균하는 방식으로, 가중치는 교차 검증을 통해 최적화된다. 최종 유사도 행렬을 이용해 계통수 클러스터링을 수행했을 때, 자동 전사만을 사용했을 때보다 스타일 구분 정확도가 18% 상승했으며, 특히 마르티네테와 데블라 사이의 미세한 구분이 명확히 드러났다. 논문은 또한 ‘전문가 라벨링 비용’과 ‘자동 전사 확장성’ 사이의 트레이드오프를 논의하며, 향후 대규모 전통 음악 데이터베이스 구축에 있어 두 접근법을 혼합하는 하이브리드 파이프라인의 필요성을 강조한다.


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...