가사와 음악 복잡성이 말 인식에 미치는 영향

본 연구는 배경음악에 가사가 포함될 때와 포함되지 않을 때, 그리고 음악의 리듬 복잡도가 말 인식에 미치는 영향을 조사하였다. 네덜란드어 CVC 단어를 세 가지 SNR(+15, +5, 0 dB)에서 세 곡의 배경음악(복잡한 Afrobeat, 단순한 Trip‑Hop, 단순한 Funk)과 함께 제시하였다. 결과는 가사가 있는 음악이 가사가 없는 음악보다 특히 낮은 SNR에서 말 인식 정확도를 현저히 낮추며, 음악 복잡도는 전반적인 마스킹 효과에 큰…

저자: Odette Scharenborg, Martha Larson

가사와 음악 복잡성이 말 인식에 미치는 영향
본 논문은 배경음악이 대화에 미치는 구체적 영향을 규명하고자, 특히 가사의 존재와 음악의 리듬 복잡성이 말 인식에 미치는 마스킹 효과를 실험적으로 탐구하였다. 서론에서는 사회적 공간에서 음악이 분위기 조성 및 프라이버시 제공 역할을 하지만, 부적절한 선택은 청각 피로와 대화 방해를 초래한다는 점을 강조한다. 기존 연구는 배경소음이 말 인식에 미치는 일반적 효과를 다루었으나, 음악의 구체적 특성—특히 가사와 복잡도—에 대한 체계적 조사는 부족했다. 관련 연구에서는 가사가 포함된 음악이 작업 효율을 저하시킨다는 보고와, 배경음악이 에너지 마스킹과 정보적 마스킹을 동시에 유발한다는 이론적 배경을 제시한다. 특히, 가사는 언어적 정보가 포함돼 청자의 인지 자원을 경쟁적으로 차지함으로써 정보적 마스킹을 강화한다는 가설을 세운다. 실험 설계는 네덜란드어 원어민 20명을 대상으로, 150개의 CVC 단어를 세 가지 SNR(+15, +5, 0 dB)에서 들려주고, 배경음악은 가사가 있는 버전과 없는 버전으로 구분하였다. 음악은 실제 레스토랑에서 사용되는 곡 세 가지를 선정했으며, 각각 복잡한 Afrobeat(곡 1), 단순한 Trip‑Hop(곡 2), 단순한 Funk(곡 3)로 리듬 복잡도를 조절하였다. 가사와 무가사 구간은 동일한 악기와 비트를 유지하도록 정교히 편집했으며, 1분 길이의 스트레치를 확보하였다. 각 단어 앞뒤에 200 ms의 배경음악을 삽입하고, 페이드 인·아웃을 적용해 급격한 전이를 방지하였다. 실험 리스트는 12개로 구성돼 SNR·가사·곡 종류가 무작위·균등 배분되었으며, 피험자는 개인 부스에서 헤드폰을 착용하고 단어를 듣고 타이핑했다. 결과 분석은 GLMM을 이용해 정답 여부를 종속 변수로, SNR과 가사 유무를 고정 효과, 피험자·단어·곡을 랜덤 효과로 모델링했다. 모델 적합도는 AIC 기준으로 범주형 SNR이 연속형보다 우수했으며, 주요 결과는 다음과 같다. 첫째, 가장 쉬운 +15 dB 조건에서는 가사 유무에 따른 차이가 없었다. 둘째, +5 dB와 0 dB 조건에서는 가사가 포함된 음악이 정답률을 유의하게 낮추었다(p < .001). 셋째, 곡별 분석에서도 가사 효과가 일관되게 나타났으며, 특히 복잡한 리듬을 가진 Song 1에서는 가장 큰 마스킹 효과가 관찰되었다. 이는 퍼커션 밀도가 높은 복잡한 리듬이 에너지 마스킹을 강화한다는 기존 연구와 일치한다. 논의에서는 가사가 있는 음악이 낮은 SNR 상황에서 정보적 마스킹과 에너지 마스킹을 동시에 유발해 말 인식을 크게 방해한다는 점을 강조한다. 반면, 음악 복잡성 자체는 전체적인 마스킹 수준에 큰 차이를 만들지는 않지만, 복잡한 리듬이 포함된 경우 에너지 마스킹이 약간 증가할 수 있음을 시사한다. 실용적 함의로는 레스토랑·카페·바 등 대화가 중요한 환경에서 가사가 없는 인스트루멘털 트랙을 선택하거나, 음악 볼륨을 조절해 SNR을 높이는 것이 대화 유지에 도움이 된다. 한계점으로는 참가자 수가 상대적으로 적고, 네덜란드어에 국한된 점, 그리고 음악 장르가 제한적이었다는 점을 들 수 있다. 향후 연구에서는 다양한 언어와 문화권, 더 넓은 장르와 복잡도 지표를 포함해 청각 ‘글림프’(청취 가능한 시간‑주파수 영역) 분석을 통해 에너지 마스킹 메커니즘을 정량화할 필요가 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기