RAG‑HAR 검색 증강 생성 기반 인간 활동 인식

읽는 시간: 2 분
...

📝 원문 정보

  • Title: RAG-HAR: Retrieval Augmented Generation-based Human Activity Recognition
  • ArXiv ID: 2512.08984
  • 발행일: 2025-12-06
  • 저자: Nirhoshan Sivaroopan, Hansi Karunarathna, Chamara Madarasingha, Anura Jayasumana, Kanchana Thilakarathna

📝 초록 (Abstract)

인간 활동 인식(HAR)은 의료·재활·피트니스 트래킹·스마트 환경 등 다양한 분야의 기반 기술이지만, 기존 딥러닝 방식은 데이터셋별 학습, 대규모 라벨링된 코퍼스, 막대한 연산 자원을 필요로 한다. 본 연구에서는 학습이 필요 없는 검색‑증강 프레임워크인 RAG‑HAR를 제안한다. RAG‑HAR는 경량 통계 기술자를 이용해 입력 시계열을 요약하고, 이를 벡터 데이터베이스에서 의미적으로 유사한 샘플을 검색한다. 검색된 컨텍스트 정보를 LLM에 프롬프트로 제공함으로써 활동을 식별한다. 또한 프롬프트 최적화와 LLM 기반 활동 기술자(Descriptor)를 도입해, 컨텍스트가 풍부한 벡터 데이터베이스를 사전 생성하고, 보다 정확하고 관련성 높은 증거를 제공한다. 이러한 메커니즘을 통해 RAG‑HAR는 6개의 이질적인 HAR 벤치마크에서 최첨단 성능을 달성했으며, 모델 학습이나 파인튜닝 없이도 높은 견고성과 실용성을 입증한다. 나아가 RAG‑HAR는 기존에 학습되지 않은 새로운 인간 활동을 인식하고 의미 있게 라벨링하는 능력을 보여, 알려진 행동을 넘어서는 HAR의 새로운 가능성을 제시한다.

💡 논문 핵심 해설 (Deep Analysis)

Figure 1
RAG‑HAR는 “Retrieval‑Augmented Generation”(RAG) 개념을 인간 활동 인식 분야에 적용한 최초의 시도 중 하나로, 기존 딥러닝 기반 HAR이 갖는 몇 가지 근본적인 한계를 효과적으로 극복한다. 첫 번째 한계는 대규모 라벨링 데이터에 대한 의존성이다. 대부분의 최신 HAR 모델은 센서 데이터(가속도, 자이로 등)를 직접 입력으로 받아 복잡한 시계열 네트워크(CNN, LSTM, Transformer 등)를 학습한다. 이러한 접근은 데이터 수집·라벨링 비용이 높은 의료·재활 현장에서 실용적이지 않다. RAG‑HAR는 대신 경량 통계 기술자(예: 평균, 표준편차, 피크‑투‑피크 등)를 사용해 입력 시계열을 저차원 벡터로 변환한다. 이 벡터는 기존에 구축된 벡터 데이터베이스와 비교되어 의미적으로 가장 유사한 샘플들을 빠르게 검색한다. 여기서 “의미적 유사성”은 단순 거리 기반이 아니라, 사전 학습된 임베딩 모델(예: Sentence‑BERT) 혹은 LLM 자체가 제공하는 임베딩을 활용해 확보한다. 따라서 데이터베이스에 포함된 다양한 활동 샘플이 풍부한 컨텍…

📄 논문 본문 발췌 (Translation)

...(본문 내용이 길어 생략되었습니다. 사이트에서 전문을 확인해 주세요.)

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키