식사 중 손목 움직임으로 식사량 자동 측정: 인구통계·음식 변수별 정확도 평가
본 연구는 식사 중 손목에 부착한 저전력 센서를 이용해 한 입(바이트)을 자동으로 감지하는 알고리즘의 정확성을 검증한다. 271명의 대학생·교직원을 카페테리아에서 자유롭게 식사하도록 하여 24 088개의 바이트와 374종의 음식·음료 데이터를 수집하였다. 비디오와 센서 데이터를 동기화해 인간 라이터가 ground‑truth를 만든 뒤, 알고리즘의 민감도는 75 %, 양성예측값(PPV)은 89 %로 보고되었다. 민감도는 연령·성별·인종 등 인구통…
저자: Yiru Shen, James Salley, Eric Muth
본 논문은 손목에 부착한 저전력 MEMS 가속도·자이로 센서를 이용해 식사 중 손목 롤 동작을 감지하고, 이를 기반으로 한 입(바이트)을 자동으로 카운트하는 알고리즘의 정확성을 평가한다. 연구 배경으로는 비만과 관련된 만성질환 예방을 위해 에너지 섭취량을 정확히 측정하는 도구가 필요하다는 점을 들며, 기존 설문·식사일지 방식은 자기보고에 의존해 편향과 부담이 크다는 한계를 지적한다. 손목 착용형 웨어러블은 일상 생활에 방해되지 않으며, 기존 연구에서 49명을 대상으로 86 % 민감도와 81 % PPV를 기록했지만, 실생활 적용성을 검증하기 위해 대규모 자연식사 환경에서 추가 실험을 설계하였다.
실험은 미국 사우스캐롤라이나 주 클렘슨 대학교의 대형 식당(Harcombe Dining Hall)에서 진행되었다. 총 276명의 지원자를 모집했으며, 데이터 손실(비디오·센서 오류) 5명을 제외하고 271명의 최종 데이터가 분석에 사용되었다. 참가자는 18세에서 75세까지 다양했으며, 성별(131명 남성, 140명 여성), 인종(아프리카계 미국인 26명, 아시아·태평양 섬 29명, 백인 190명, 히스패닉 11명, 기타 15명) 등 인구통계적 다양성을 확보했다. 각 참가자는 자유롭게 식당에서 원하는 음식을 선택하고, 손목에 센서를 착용한 뒤 자연스럽게 식사했다. 한 번에 최대 4명의 참가자를 동일 테이블에 배치했으며, 필요 시 식사 중간에 센서를 잠시 제거하고 다시 착용하는 방식으로 여러 코스(평균 1.8코스/참가자)를 기록했다.
동시 촬영된 4대의 천장 카메라는 참가자의 입·상체·트레이를 포착했으며, 센서와 카메라는 동일 컴퓨터에 연결돼 타임스탬프를 통해 정확히 동기화되었다. 수집된 센서 데이터는 1 초 가우시안 윈도우(표준편차 0.23 s)로 스무딩했으며, 이후 알고리즘 적용 전처리 단계로 사용했다.
Ground truth 라벨링은 22명의 라이터가 1,000시간 이상 투입해 수행했다. 라이터는 비디오와 센서 데이터를 동시에 보며, 음식이 입에 들어가는 순간을 프레임 단위로 정확히 지정하고, 해당 바이트의 음식 종류, 사용 손, 식기, 용기를 기록했다. 두 명이 독립 라벨링한 뒤, 1 초 이내에 일치하는 바이트가 있으면 시간 평균을 취하고, 변수(음식·손·식기·용기) 중 불일치가 있으면 제3 라이터가 검증·수정했다. 라벨링 오류는 누락된 바이트 3.7 %, 시간 오차 5 %, 정체성 오류 3 %, 데이터 입력 오류 4.4 % 수준으로 보고, 라벨링 품질이 충분히 확보되었음을 확인했다.
알고리즘은 손목 롤 속도가 양의 임계값(T1) 초과 → 일정 시간 대기(T3) → 음의 임계값(T2) 초과 → 다음 바이트와 최소 간격(T4)이라는 네 단계 이벤트를 탐지한다. 파라미터는 기존 실험에서 최적화된 T1=T2=10, T3=2, T4=8을 기본값으로 사용했으며, 급식실에서 평균 식사 속도가 빨라 T4를 단축한 경우도 비교했다.
평가 방법은 검출된 바이트와 ground truth를 매칭하는 윈도우 기반 매칭 방식을 채택했다. 검출된 바이트가 실제 바이트와 매칭되면 True(T), 매칭되지 않으면 False(F), 매칭되지 않은 실제 바이트는 Undetected(U)로 분류한다. 민감도는 T/(T+U)로, 양성예측값(PPV)은 T/(T+F)로 계산했다. 특이도는 정의되지 않아 PPV를 대신 사용했다.
전체 결과는 민감도 75 %, PPV 89 %였다. 인구통계별 민감도는 62 %에서 86 % 사이로 차이를 보였으며, 특히 연령이 높고 식사 속도가 느린 그룹에서 민감도가 높았다. 성별·인종 간 차이는 크지 않았지만, 평균 식사 속도가 빠른 경우(예: 20대 남성) 민감도가 낮았다. 음식 종류별 분석에서는 손목 움직임 진폭이 큰 고형 음식(스테이크, 큰 샌드위치 등)에서 민감도가 80 % 이상으로 높았고, 수프·음료와 같이 머리·입 움직임이 주를 이루는 경우에는 60 % 이하로 떨어졌다. 이는 알고리즘이 손목 롤에 의존하기 때문에, 손이 입에 가까워지는 동작이 약하거나 비대칭적인 경우 검출이 어려워지는 구조적 한계를 보여준다. 식기(포크·숟가락·젓가락·손)와 용기(접시·그릇·컵·머그)별 민감도 차이는 미미했으며, 손 사용(좌·우·양손)도 큰 영향을 주지 않았다.
논문의 의의는 자연스러운 급식 환경에서 대규모 데이터를 확보해 기존 실험실 기반 검증을 확장했으며, 라벨링 프로세스를 체계화해 데이터 품질을 보장한 점이다. 또한, 손목 센서만으로도 75 % 수준의 민감도와 89 % PPV를 달성해, 일상 생활에서 에너지 섭취량을 추정하는 실용적인 도구로 활용 가능함을 시사한다.
한계점으로는 (1) 손목 롤에만 의존해 머리·입 움직임을 직접 측정하지 못해 특정 음식·음료에서 검출률이 낮아지는 구조적 제약, (2) 15 Hz 샘플링이 빠른 손동작을 충분히 포착하지 못할 가능성, (3) 라벨링에 많은 인력과 시간이 소요돼 확장성에 비용이 든다는 점을 들었다. 향후 연구에서는 (가) 목·턱 부착 센서와 결합해 다중 모달 데이터를 활용, (나) 고주파(>50 Hz) 샘플링으로 손목 동작을 정밀히 포착, (다) 머신러닝 기반 동적 임계값 조정으로 개인별 식사 속도와 스타일에 적응하는 알고리즘을 개발하는 방안을 제시한다. 이러한 개선이 이루어진다면, 웨어러블 기반 섭취량 모니터링이 비만 예방·관리, 임상 영양 평가, 개인 맞춤형 건강 관리 등에 널리 적용될 수 있을 것으로 기대된다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기