EDA를 위한 전용 파운데이션 모델 UME와 대규모 데이터셋 EDAMAME

본 논문은 24개의 공개 데이터셋을 통합해 25 000시간·634명의 EDA 데이터를 담은 EDAMAME을 구축하고, 이를 기반으로 전용 파운데이션 모델 UME를 학습한다. UME는 10가지 다운스트림 과제 중 8가지에서 기존 베이스라인을 능가하며, 일반 시계열 파운데이션 모델과 동등한 성능을 내면서도 연산 비용을 20배 절감한다. 연구는 EDA 데이터의 다양성과 한계도 조명한다.

저자: Leonardo Alchieri, Matteo Garzon, Lidia Alecci

EDA를 위한 전용 파운데이션 모델 UME와 대규모 데이터셋 EDAMAME
본 논문은 전기피부활동(Electrodermal Activity, EDA) 신호에 특화된 파운데이션 모델을 최초로 제시하고, 이를 가능하게 한 대규모 공개 데이터셋인 EDAMAME을 구축·공개한다. 연구 배경으로는 최근 파운데이션 모델이 자연어·컴퓨터 비전 분야를 넘어 시계열 데이터, 특히 생리 신호 분야로 확장되고 있으나, EDA와 같은 자율신경계 신호는 데이터가 부족해 모델 개발이 지연되고 있다는 점을 들었다. 기존에 대규모 EDA 데이터는 Fitbit Sense 2와 같은 기업 소유의 프로프라이어터리 데이터에 국한돼 있었으며, 공개적으로 접근 가능한 데이터는 소규모 실험실 수준에 머물렀다. 데이터 구축 단계에서는 24개의 공개 웨어러블 데이터셋을 선정했다. 선정 기준은 (1) Empatica E4 디바이스를 사용한 원시 EDA 포함, (2) 공개 혹은 데이터 공유 계약을 통해 접근 가능, (3) 스트레스·수면·일상·직장 등 다양한 상황에서 수집, (4) 최소 100명·1000시간의 데이터 확보 등이다. 최종적으로 25 000시간·634명의 데이터를 모아 EDAMAME을 구성했으며, 모든 데이터는 4 Hz 샘플링, UTC 표준 시간, 결측값은 0으로 대체하는 일관된 전처리 과정을 거쳤다. 데이터 다양성은 시나리오별(수면, 스트레스·감정 유도, 참여, 실시간 스트레스, 직장 분석, 일상 생활)로 고르게 분포했으며, 각 시나리오마다 EDA 값의 분포와 변동성이 다르게 나타나 모델이 다양한 상황을 학습하도록 설계되었다. 모델 설계에서는 60초 윈도우를 275 M개 샘플링해 트랜스포머 기반의 자기지도 학습 프레임워크를 적용했다. 구체적으로는 컨트라스트ive 손실과 마스크 복원 손실을 결합해 시계열의 전후 관계와 지역적 패턴을 동시에 학습하도록 했다. 학습 과정에서 배치 정규화와 레이어 정규화를 활용해 개인별 기저선 차이를 완화했으며, 데이터 증강(시간 축소·확대, 잡음 추가)으로 일반화 능력을 강화했다. 평가에서는 10가지 다운스트림 태스크를 선정했으며, 여기에는 스트레스 분류, 인지 부하 추정, 감정 인식, 수면 단계 구분, 일상 활동 인식 등이 포함된다. 각 태스크마다 기존의 handcrafted feature 기반 모델(예: 시간 도메인 통계, 비선형 지표)과 일반 시계열 파운데이션 모델(Mantis, Chronos)과 비교했다. UME는 8/10 태스크에서 평균 4~7%p의 balanced accuracy 향상을 보였고, 특히 스트레스·감정 유도와 수면 모니터링에서 두드러진 성능을 기록했다. 연산 효율성 측면에서는 동일한 하드웨어 환경에서 UME가 20배 적은 FLOPs를 사용했음에도 불구하고, 일반 시계열 파운데이션 모델과 동등하거나 더 나은 결과를 도출했다. 하지만 성능 분석에서 몇 가지 한계가 드러났다. 첫째, 대부분의 태스크에서 balanced accuracy가 0.7을 넘지 못해 실제 적용 시 오탐·누락 위험이 존재한다. 둘째, 데이터 라벨링이 실험마다 다르게 정의돼 있어 모델이 라벨 불일치에 민감하게 반응한다. 셋째, 개인별 기저선 차이와 환경 잡음(예: 온도·습도·운동)으로 인해 동일 상황에서도 EDA 패턴이 크게 변동한다. 이러한 요인들은 모델의 일반화 한계를 초래하고, 추가적인 정규화·도메인 적응 기법이 필요함을 시사한다. 연구의 의의는 두 가지 측면에서 강조된다. 첫째, EDAMAME은 EDA 연구에 필요한 규모와 다양성을 최초로 제공함으로써 향후 데이터 기반 연구와 파운데이션 모델 개발의 기반을 마련한다. 둘째, UME는 전용 파운데이션 모델이 일반 시계열 모델과 경쟁력 있는 성능을 보이며, 연산 효율성까지 확보할 수 있음을 증명한다. 이는 실시간 스트레스 모니터링, 개인 맞춤형 정신건강 관리, 인간-컴퓨터 인터페이스 등 다양한 응용 분야에 바로 적용 가능성을 열어준다. 마지막으로 저자들은 공개된 데이터와 코드, 모델 가중치를 통해 재현성을 보장하고, 향후 연구자들이 멀티모달 파운데이션 모델(EDA·PPG·ECG·음성·영상)과 결합하거나, 라벨링 자동화·도메인 적응 기법을 추가해 성능을 향상시킬 수 있는 기반을 제공한다. 또한, 개인별 정규화, 잡음 억제, 실시간 추론 최적화 등 실용적인 연구 과제들을 제시하며, EDA 신호가 가진 고유의 복잡성을 극복하기 위한 지속적인 연구 필요성을 강조한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기