시계열 분류를 위한 딥러닝 강력 베이스라인

본 논문은 시계열 데이터 분류에 있어 기존의 거리 기반(DTW‑KNN), 특징 기반(Bag‑of‑Words, Shapelet 등) 및 복합 앙상블 방법들이 요구하는 복잡한 전처리와 특징 추출 과정을 배제하고, 원시 시계열을 그대로 입력으로 하는 딥러닝 모델들을 베이스라인으로 제시한다. 제안된 모델은 크게 세 가지이며, 각각의 설계 원리와 구현 세부 사항을 다음과 같이 정리한다. 1) **Multilayer Perceptron (MLP)** - 3개의 전결합 레이어(각 500 뉴런)와 드롭아웃(입력 0.1, 은닉 0.2, 출력 0.3)으로 구성. - 활성화 함수는 ReLU를 사용해 기울기 소실 문제를 완화하고, 학습 초기에 빠른 수렴을 도모한다. - 최종 Softmax 레이어를 통해 다중 클래스 확률을 출력한다. 2) **Fully Convolutional Network (FCN)** - 1‑차원 컨볼루션 블록을 3단계로 쌓으며, 각 블록은 커널 크기 8, 5, 3을 순차 적용하고 필터 수는 128‑256‑128이다. - 각 컨볼루션 뒤에 배치 정규화와 ReLU를 배치해 학습 안정성을 높인다. - 풀링 층을 전혀 사용하지 않아 시계열 전체 길이를 보존하고, 마지막에 전역 평균 풀링(GAP)으로 특징 벡터를 압축한다. - GAP와 Softmax 사이의 가중치를 활용해 Class Activation Map(CAM)을 생성, 특정 클래스 예측에 기여한 시계열 구간을 시각화한다. 3) **Residual Network (ResNet)** - FCN의 컨볼루션 블록을 재활용하면서 잔차 연결을 도입, 3개의 Residual Block을 구성한다. - 각 블록 내부 필터 수는 64‑128‑128이며, 블록 출력에 입력을 직접 더해 Gradient 흐름을 원활히 한다. - 최종적으로 GAP와 Softmax를 적용한다. **학습 설정** - 데이터 전처리는 각 데이터셋의 학습 집합 평균·표준편차를 이용한 z‑정규화만 수행한다. - MLP는 Adadelta(학습률 0.1, ρ=0.95)로, FCN·ResNet은 Adam(학습률 0.001, β1=0.9, β2=0.999)으로 최적화한다. - 손실 함수는 범주형 교차 엔트로피이며, 가장 낮은 학습 손실을 보인 모델을 테스트 셋에 적용한다. **실험 및 평가** - UCR 타임시리즈 저장소의 44개 데이터셋을 대상으로 기존 10여 개의 최신 방법(1‑NN‑DTW, BOSS, Elastic Ensemble, Shapelet Ensemble, CO‑TE, MCNN 등)과 비교하였다. - 기존 연구에서 주로 사용되는 오류율 외에, 클래스 수 차이를 보정하기 위해 **Mean Per‑Class Error (MPCE)** 를 새롭게 정의하였다: 각 데이터셋의 오류율을 해당 클래스 수로 나눈 뒤 평균을 구한다. - 통계적 유의성을 검증하기 위해 Wilcoxon rank‑sum 테스트와 MPCE에 대한 짝지은 T‑테스트를 수행하였다. **주요 결과** - FCN은 오류율, 평균·기하 평균 순위, MPCE 모두에서 가장 우수한 성적을 기록하였다. 특히 전처리 없이 원시 시계열만으로도 기존 복잡한 파이프라인을 능가한다. - ResNet은 MPCE와 평균 순위에서 FCN에 근접했으며, 일부 데이터셋에서 과적합 현상이 관찰되었지만 전반적으로 경쟁력 있는 성능을 보였다. - MLP는 가장 낮은 성능을 보였지만, 1‑NN‑DTW와 비슷한 수준을 유지해 간단한 베이스라인으로서의 가치를 확인했다. - 통계 분석 결과, FCN·ResNet·CO‑TE·MCNN·BOSS는 MPCE 차이가 유의미하지 않은 최상위 그룹에 속했으며, 나머지 모델은 별도의 하위 그룹으로 구분되었다. **의의 및 활용** - 전역 평균 풀링을 통해 파라미터 수를 크게 감소시켰음에도 불구하고 높은 정확도를 달성함으로써, 실무에서 모델 배포와 유지보수가 용이한 구조를 제공한다. - CAM을 활용한 시각화는 모델이 어떤 시점 구간을 중요한 특징으로 인식했는지 설명 가능성을 부여, 의료·산업·금융 등 도메인 전문가와의 협업에 유리하다. - MPCE는 다중 클래스·다중 데이터셋 환경에서 모델을 공정하게 비교할 수 있는 새로운 평가 지표로, 향후 연구에서 널리 활용될 가능성이 있다. 결론적으로, 이 논문은 “전처리·특징 설계 없이 바로 적용 가능한 딥러닝 베이스라인”을 제시함으로써 시계열 분류 연구의 진입 장벽을 낮추고, 향후 더 복잡한 모델 개발 및 도메인 특화 연구를 위한 견고한 출발점을 제공한다.

시계열 분류를 위한 딥러닝 강력 베이스라인

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기