프로젝트 오케스트레이션 데이터베이스와 자동 편곡 연구

본 논문은 피아노 악보와 그에 대응하는 관현악 편곡을 쌍으로 묶은 MIDI 데이터베이스인 POD를 소개하고, 피아노 악보를 자동으로 관현악으로 변환하는 ‘프로젝트 오케스트레이션’ 과제를 정의한다. 데이터베이스 구조, 메타데이터 정규화, 자동 정렬 방법 및 학습 모델 실험을 통해 이 과제의 가능성을 검증한다.

저자: Leopold Crestel, Philippe Esling, Lena Heng

프로젝트 오케스트레이션 데이터베이스와 자동 편곡 연구
본 논문은 피아노 악보와 그에 대응하는 관현악 편곡을 쌍으로 묶은 MIDI 데이터베이스인 Projective Orchestral Database (POD)를 최초로 공개하고, 이를 활용한 자동 프로젝트 오케스트레이션(Automatic Projective Orchestration) 과제를 정의한다. 연구 배경으로는 전통적인 오케스트레이션이 피아노 악보를 기반으로 악기 배치를 결정하는 ‘프로젝션’ 방식에 초점을 맞추며, 기존 문헌에서는 피아노‑관현악 변환을 다루는 대규모 심볼릭 데이터가 부재했음을 지적한다. 데이터베이스는 392개의 MIDI 파일을 184개의 폴더(각 폴더에 피아노와 관현악 파일 한 쌍)로 구성한다. 파일은 공개된 무료 데이터베이스와 전문 편곡 교재에서 수집했으며, 악기명 표준화를 위해 각 MIDI에 대응하는 CSV 파일을 제공한다. 메타데이터에는 작곡가, 작품명, 파일 경로 등이 포함되며, 작곡가별 파일 수와 프레임 비율을 표로 제시한다. 분석 결과, 라벨, 라벨, 라벨 등 특정 작곡가와 피아노·관현악 프레임이 전체의 40% 이상을 차지하는 불균형이 존재한다. 이는 학습 모델이 특정 스타일에 편향될 위험을 내포한다는 점에서 데이터 선택이나 라벨링이 필요함을 시사한다. 피아노와 관현악 파트는 시간적으로 정렬되지 않은 경우가 많아, 저자들은 Needleman‑Wunsch(NW) 알고리즘을 기반으로 자동 정렬 파이프라인을 구현한다. 정렬 전에는 피아노‑롤(piano‑roll) 형태로 변환하고, 각 시간 프레임을 128개의 피치(강도 포함) 벡터로 표현한다. 정렬을 위한 유사도 함수는 강도 정보를 제거하고, 12개의 피치 클래스(옥타브 압축)로 축소한 뒤, 두 벡터 간 공통 음표 수와 L1 노름을 이용해 점수를 산출한다. 파라미터 C=10, gap‑open=3, gap‑extend=1을 적용해 구조적 차이를 보존하면서도 효율적인 정렬을 달성한다. 정렬된 데이터는 두 버전(원본·정렬)으로 제공되며, 정렬 메타데이터는 pickle 파일에 저장된다. 자동 프로젝트 오케스트레이션 과제는 시계열 예측 문제로 공식화된다. 입력으로 현재 피아노 프레임 P(t)와 과거 N 프레임의 관현악 프레임 O(t‑1)…O(t‑N)을 사용하고, 목표는 현재 관현악 프레임 Ō(t)를 예측하는 함수 f를 학습하는 것이다. 수식으로는 Ō(t)=f

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기