웨어러블을 이용한 감정 인식 체계적 문헌 고찰

** 본 연구는 스마트워치·손목 밴드 등 착용형 센서를 활용해 일상 생활에서 감정을 인식할 수 있는지를 체계적 문헌 고찰(SLR) 방법으로 조사한다. 감정 모델, 참여자 특성, 사용된 생리 신호·센서, 자가 평가 방식, 자극 종류, 신호 처리·특징 추출, 그리고 분류 모델까지 여섯 단계의 연구 흐름을 정리하고, 현재 분야의 주요 한계(데이터 불균형, 실험 설계 부족, 검증 방법 미비 등)를 제시한다. **

저자: Stanis{l}aw Saganowski, Anna Dutkowiak, Adam Dziadek

웨어러블을 이용한 감정 인식 체계적 문헌 고찰
** 본 논문은 “웨어러블을 이용한 감정 인식: 체계적 문헌 고찰(Work‑in‑progress)”이라는 제목으로, 착용형 디바이스가 일상 생활에서 감정을 인식하는 데 얼마나 유용한지를 조사한다. 연구는 시스템적 문헌 고찰(SLR) 방법론을 적용해 2,424편의 논문을 검색하고, 1,104편을 정밀 검토한 뒤 27편(2.5%)만이 선정 기준을 만족한다는 점을 밝힌다. 선정 기준은 (1) 다양한 감정 라벨링, (2) 개인용 웨어러블 사용, (3) 최소 하나 이상의 생리 신호 측정이며, 배제 기준은 피험자 수 5명 미만, 단일 감정만 다룸, 유선 연결 디바이스 등이다. 논문은 감정 인식 연구를 여섯 단계로 구분한다. 첫 번째는 감정 모델 선택으로, 카테고리형(예: Ekman 6가지, Plutchik 8가지)과 다차원형(Valence‑Arousal, Valence‑Arousal‑Dominance) 모델이 혼재한다. 두 번째는 참여자 모집·선별 단계로, 연령·성별·건강 상태·윤리 승인 여부 등 다양한 변수의 영향을 고려한다. 세 번째는 실험 환경 설계 단계이며, 실험실과 현장(필드) 환경을 구분하고, 현장에서는 EMA(생태학적 순간 평가) 설문이 적합하다고 제안한다. 네 번째는 웨어러블을 통한 생리 신호 수집 단계로, ECG, PPG, GSR, EEG, 호흡(RSP), 체온(BT) 등 6가지 기본 신호와 파생 파라미터(HR, HRV, IBI, BVP 등)를 활용한다. 상용 디바이스(Empatica E4, Microsoft Band 2, Samsung Gear S 등)와 자체 제작 디바이스가 비교되며, 각 디바이스의 센서 종류, 데이터 품질, 착용 편의성, 배터리 수명 등을 평가한다. 다섯 번째 단계는 자기 보고식 감정 라벨링이다. 대부분의 연구가 Likert 척도, SAM, IAPS, PANAS 등 표준 설문을 사용하지만, 라벨링 방법이 불명확하거나 상세히 기술되지 않은 경우가 다수이다. 라벨링의 주관성, 실시간성, 그리고 라벨과 신호 간 동기화 문제는 여전히 큰 도전 과제로 남는다. 여섯 번째 단계는 신호 전처리·특징 추출·특징 선택·분류 모델 구축이다. 전처리에서는 저역·대역·노치 필터, 정규화, 윈도우화 등이 주로 사용된다. 특징 추출은 시간 영역(피크, 구간, 평균 등), 주파수 영역(PSD, 스펙트럼), 시간‑주파수 영역(STFT, 웨이브릿) 및 통계·비선형(엔트로피, 복잡도) 지표로 다양하게 이루어진다. 그러나 대부분의 논문이 특징 선택을 수행하지 않으며, 선택된 경우에도 유전 알고리즘이나 순차 전진 선택 정도에 그친다. 분류 모델은 SVM이 가장 흔히 사용되었고, Random Forest, k‑NN, Naïve Bayes 등도 일부 적용되었다. 딥러닝(Convolutional Neural Network, Long Short‑Term Memory) 적용은 4편에 불과하며, 데이터 양과 라벨 불균형 때문에 정확도 외에 F1‑score, ROC‑AUC 등 적절한 평가 지표가 부족한 경우가 많다. 교차검증(k‑fold, leave‑one‑out)과 개인별 맞춤 모델 구축 여부에 대한 논의도 제한적이며, 일반화된 모델과 개인화 모델 간 성능 차이를 체계적으로 비교한 연구는 거의 없다. 논문은 현재 분야의 주요 한계점을 다음과 같이 정리한다. 첫째, 데이터 불균형과 라벨링의 주관성 문제를 해결하기 위한 표준화된 프로토콜이 부재하다. 둘째, 현장 실험 설계가 부족해 실시간 데이터 수집과 라벨링 간 동기화가 어려우며, 실험 환경에 따른 노이즈 관리가 미흡하다. 셋째, 특징 선택 및 차원 축소 방법이 단순하거나 생략되어 모델 복잡도가 불필요하게 높아진다. 넷째, 성능 평가가 정확도에만 의존하고, 불균형 데이터에 적합한 지표와 통계적 검증이 부족하다. 마지막으로, 개인별 맞춤 모델과 일반 모델 간의 트레이드오프를 탐색하는 연구가 거의 없으며, 실제 퍼베이시브 컴퓨팅 환경에서의 배포 가능성을 검증한 사례가 드물다. 이러한 분석을 바탕으로 저자들은 향후 연구 방향으로 (1) 표준화된 감정 라벨링 및 데이터 수집 프로토콜 구축, (2) 데이터 불균형 해결을 위한 샘플링·가중치 기법 적용, (3) 자동화된 특징 선택 및 차원 축소 파이프라인 개발, (4) 딥러닝 기반 멀티모달 모델의 실시간 구현 및 에너지 효율성 검증, (5) 개인화 모델과 일반화 모델의 비교 연구 및 하이브리드 접근법 제안 등을 제시한다. **

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기