노이즈 신호 분류를 위한 푸리에 변환 대체 데이터 활용
본 논문은 푸리에 변환(FT) 위상 무작위화를 통해 생성한 대체 신호(FT surrogate)를 이용해 수면 단계 분류에서 클래스 불균형을 완화하고, 신경망 학습을 향상시키는 방법을 제안한다. CAPSLPDB 데이터베이스의 희귀 수면 단계(S1, S3 등)를 FT surrogate로 증강한 결과, 평균 F1‑score가 7 % 상승하였다. 또한, 부분 구간을 surrogate로 교체하는 방식의 새로운 saliency map 기법을 소개하여, 각…
저자: Justus T. C. Schwabedal, John C. Snyder, Ayse Cakmak
본 논문은 “노이즈 신호 분류 문제에서 클래스 불균형을 푸리에 변환 대체 데이터(Fourier Transform Surrogates)를 이용해 해결한다”는 목표 아래, 두 가지 핵심 연구를 전개한다. 첫 번째는 FT surrogate를 활용한 데이터 증강 및 클래스 균형화 방법이며, 두 번째는 FT surrogate 기반의 새로운 saliency map 기법을 통한 모델 해석이다.
1. **배경 및 문제 정의**
생체 신호(EEG, EOG, EMG 등)의 분류 작업은 종종 특정 클래스가 전체 데이터의 극히 일부분을 차지하는 불균형 문제에 직면한다. 전통적인 방법으로는 비용 함수에 가중치를 부여하거나, 과소표본(under‑sampling)·과다표본(over‑sampling) 전략을 사용한다. 그러나 전자는 모델 구조에 제한을 두고, 후자는 중요한 정보를 손실하거나 과적합을 초래한다. 최근에는 GAN 기반 생성 모델이 제안되었지만, 데이터 양이 충분히 많지 않은 경우 학습이 불안정하고 희귀 클래스의 다양성을 확보하기 어렵다.
2. **FT surrogate 개념**
시간‑주파수 영역에서 신호는 복소수 푸리에 계수 sₙ = aₙ·e^{iφₙ} 로 표현된다. 여기서 진폭 aₙ는 신호의 파워 스펙트럼을, 위상 φₙ는 시간적 구조를 담당한다. 선형·정상성 가정 하에, 동일한 진폭을 유지하면서 위상을 무작위(0~2π)로 재배열하면 원본과 동일한 통계적 특성을 갖는 새로운 시계열 yₙ를 얻을 수 있다. 이 과정을 역푸리에 변환하면 FT surrogate가 생성된다. 비정상 구간이 존재하면 파워가 전체 구간에 고르게 퍼지는 현상이 나타나며, 이는 원본 신호와 시각적으로 차이를 만든다. 이러한 한계를 보완하기 위해 Schreiber 등은 시간 영역의 분포까지 맞추는 IAAFT(Iterative Amplitude Adjusted FT) 알고리즘을 제안했으며, 본 논문에서도 IAAFT surrogate를 비교 대상으로 사용한다.
3. **데이터베이스 및 전처리**
CAPSLPDB 수면 데이터베이스(101개 밤)에서 5개의 연령대별로 균등하게 샘플링하고, 각 기록을 30 초 에포크로 나눈다. 사용 채널은 EEG 2, EOG 1, EMG 1이며, 신호는 32 Hz로 다운샘플링하고 13 Hz 저역통과 필터링한다. 클래스 분포는 Wake, S1, S2, S3, S4, REM 순으로 불균형하며, 특히 S1이 전체의 약 4 %에 불과하다.
4. **네트워크 아키텍처**
각 채널은 독립적인 1D CNN 파이프라인을 통과한다. 파이프라인은 4개의 Conv‑ReLU‑Dropout 블록으로 구성되며, EEG 두 채널은 파라미터를 공유한다. 파이프라인 출력은 (시간, 채널, 필터) 형태의 텐서로 결합된 뒤, 2D Conv‑ReLU‑MaxPool → Dense‑Dropout → Dense‑Softmax 순으로 최종 6‑클래스 확률을 출력한다. 학습은 RMSProp(learning rate 0.0016, decay 0.9)으로 7000 배치(128 샘플)까지 진행한다.
5. **클래스 균형화와 증강 전략**
소수 클래스에 대해 가장 빈번한 클래스와 동일한 샘플 수가 되도록 복제 횟수 n_c 를 계산한다. 복제 수는 β∈
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기