EEG 데이터 효율 압축을 위한 하이브리드 손실·무손실 기법
본 논문은 EEG 신호를 먼저 표준화·세분화한 뒤, 손실 압축(DCT 또는 DWT)과 무손실 압축(RLE 또는 Arithmetic Coding)을 순차적으로 적용하는 하이브리드 압축 체계를 제안한다. 실험 결과 DCT‑RLE 조합이 90 % CR(압축률)·RMSE 0.14, 95 % CR·RMSE 0.2 수준에서 가장 높은 성능과 짧은 처리 시간을 보였으며, 복잡도 면에서도 우수함을 확인하였다.
저자: Madyan Alsenwi, Tawfik Ismail, M. Saeed Darweesh
본 논문은 고샘플링 레이트로 인해 대용량이 되는 뇌전도(EEG) 데이터를 효율적으로 저장·전송하기 위한 하이브리드 압축 시스템을 제안한다. 시스템은 크게 전처리(preprocessing), 압축(compression), 복원(reconstruction), 데이터 결합(data combiner) 네 단계로 구성된다.
전처리 단계에서는 먼저 EEG 신호를 표준화한다. 표준화는 평균을 0, 표준편차를 1로 변환해 모든 채널이 동일한 스케일을 갖게 하며, 이는 이후 변환 단계에서 계수들의 분포를 집중시켜 압축 효율을 높인다. 이어서 일정 시간 구간(Ts)마다 데이터를 세분화한다. 세그멘테이션은 데이터 크기를 제한하고, 실시간 처리에 필요한 최소 구간을 확보한다. Ts는 손실 압축, 임계값 적용, 무손실 압축, 그리고 각각의 역변환에 소요되는 시간 중 최댓값으로 정의되며, 최소 Ts가 전체 압축·복원 시간을 최소화한다.
압축 단계는 손실 압축과 무손실 압축을 순차적으로 적용한다. 손실 압축으로는 이산코사인변환(DCT)과 이산웨이브렛변환(DWT) 중 하나를 선택한다. DCT는 신호 에너지를 저차 계수에 집중시켜 대부분의 계수를 거의 0에 가깝게 만든다. DWT는 Haar 기반으로 고주파(디테일)와 저주파(근사) 성분을 분리하지만, DCT에 비해 스파시티가 낮아 무손실 단계에서 압축 효율이 떨어진다. 손실 변환 후에는 임계값(threshold)을 적용해 일정 이하의 계수를 0으로 만든다. 임계값을 조정함으로써 0값의 비율을 조절하고, 이에 따라 압축률(CR)과 재구성 오차(RMSE) 사이의 트레이드오프를 제어한다.
무손실 압축으로는 런-길이 인코딩(RLE)과 산술 코딩(Arithmetic Coding) 중 하나를 적용한다. RLE는 연속된 동일값을 (값, 길이) 쌍으로 압축하는 가장 단순한 방법으로, 변환 후 0값이 대량으로 존재할 때 압축 효율이 크게 상승한다. 산술 코딩은 심볼 확률에 기반한 엔트로피 코딩으로, 데이터가 고르게 분포될 경우 높은 압축률을 기대할 수 있지만 구현 복잡도와 연산 시간이 크게 증가한다.
복원 단계에서는 무손실 압축의 역변환을 수행한 뒤, 손실 압축의 역변환(IDCT 또는 IDWT)을 적용해 원본 신호를 재구성한다. 최종적으로 복원된 세그먼트를 결합해 전체 EEG 신호를 복원한다.
성능 평가는 세 가지 지표를 사용한다. 1) RMSE는 원본과 복원 신호 사이의 평균 제곱근 오차를 측정해 신호 손실 정도를 나타낸다. 2) 압축률(CR)은 원본 데이터 크기 대비 압축 후 데이터 크기의 감소 비율을 백분율로 나타낸다. 3) 총 시간(T)은 압축 시간과 복원 시간을 합산한 값으로, 실시간 적용 가능성을 평가한다.
실험은 Python 환경에서 Intel i3‑3.9 GHz CPU와 8 GB RAM을 사용해 1 MB 크기의 EEG 데이터를 대상으로 수행되었다. 결과는 다음과 같다. DCT‑RLE 조합이 가장 높은 압축률을 보였으며, CR = 90 %에서 RMSE = 0.14, CR > 95 %에서 RMSE ≈ 0.2를 달성했다. DCT‑Arithmetic 조합은 압축률은 비슷하지만 처리 시간이 현저히 길어 실시간 적용에 부적합했다. DWT‑RLE는 압축률이 DCT‑RLE보다 약간 낮지만, 구현이 간단하고 처리 시간이 짧아 대안으로 고려될 수 있다. 세그멘트 크기를 늘리면 압축률이 약간 상승하지만, 압축·복원 시간이 증가하는 트레이드오프가 존재한다.
결론적으로, 손실 변환(DCT 또는 DWT) 후 임계값을 적용해 데이터의 스파시티를 높이고, 이를 무손실 압축(RLE 또는 Arithmetic)으로 최종 압축하는 하이브리드 구조가 EEG 데이터의 효율적인 압축에 유효함을 입증하였다. 특히 DCT‑RLE 조합은 높은 압축률, 낮은 RMSE, 짧은 처리 시간을 동시에 만족시켜 실시간 의료 모니터링, 원격 진단, 그리고 저전력 무선 센서 네트워크 등에 적용하기에 적합하다. 향후 연구에서는 제안된 방식을 FPGA나 ASIC 등 하드웨어로 구현해 실제 임상 환경에서의 성능을 검증하고, 다채널 EEG 및 잡음이 포함된 실제 데이터에 대한 견고성을 평가할 계획이다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기