형태소 강화 대형 언어 모델을 이용한 일반화 가능한 RF 지문 인식
초록
본 논문은 가변 길이 2차원 형태소와 사전 학습된 대형 언어 모델을 결합하여 RF 지문 인식의 도메인 이동 문제와 해석성 부족을 동시에 해결하는 프레임워크를 제안한다
형태소는 I/Q 신호의 지역 패턴을 압축적으로 표현하고
LLM은 전역적인 시퀀스 의존성을 학습하여 적은 파라미터 업데이트만으로도 다양한 환경에 일반화한다
또한 프로토타입 기반의 few‑shot 추론을 지원해 새로운 도메인에서도 재학습 없이 높은 정확도를 달성한다
상세 분석
본 연구는 RF 지문 인식에 두 가지 핵심 모듈을 도입한다 첫째는 가변 길이 2차원 형태소 모듈이다 형태소는 I와 Q 두 채널을 동시에 고려한 2D 서브시퀀스로서 각 디바이스가 갖는 미세한 하드웨어 불완전성을 지역 패턴 형태로 추출한다
학습 가능한 형태소 집합은 차별적인 거리 함수를 통해 클래스 별로 최적화되며 형태소와 입력 신호 간의 유사도는 내적 혹은 유클리드 거리 기반으로 계산된다
이 과정에서 형태소는 인간이 직관적으로 이해할 수 있는 시각적 패턴을 제공하므로 모델의 해석성을 크게 향상시킨다
둘째는 사전 학습된 대형 언어 모델(LLM)이다 기존 LLM은 텍스트 데이터를 대상으로 학습되었지만 최근 연구에서 시계열 데이터에도 강력한 표현 학습 능력을 보였다 본 논문은 I/Q 신호를 1차원 토큰 시퀀스로 변환한 뒤 임베딩 레이어를 통해 LLM 입력 공간에 매핑한다
LLM의 파라미터는 대부분 고정하고 위치 임베딩과 레이어 정규화 파라미터만 미세 조정함으로써 학습 비용을 최소화한다
이러한 설계는 LLM이 사전 학습 단계에서 획득한 전역적 컨텍스트 모델링 능력을 그대로 활용하게 하여 도메인 이동 상황에서도 견고한 특징을 추출한다
또한 프로토타입 네트워크 개념을 차용해 각 클래스별 대표 벡터(프로토타입)를 LLM 출력 공간에 저장한다 프로토타입은 소수의 샘플만으로도 업데이트 가능하므로 few‑shot 상황에서 새로운 디바이스나 환경에 빠르게 적응한다
추론 시 입력 신호는 형태소와 LLM 특징을 결합한 후 프로토타입과의 거리 기반 분류를 수행한다 이때 거리 계산은 형태소 유사도와 LLM 임베딩 거리의 가중합으로 정의되어 두 모듈의 장점을 균형 있게 반영한다
실험은 Wi‑Fi, LoRa, BLE 등 6개의 데이터셋을 대상으로 수행되었으며 소스 도메인과 타깃 도메인 모두에서 기존 딥러닝 기반 방법들을 크게 앞섰다 특히 도메인 적응 없이도 cross‑domain 정확도가 10% 이상 향상되었으며 few‑shot 설정에서도 5‑shot 이하의 샘플로 높은 정확도를 유지했다
전체적으로 이 프레임워크는 (1) 지역 패턴을 명시적으로 포착하는 형태소를 통한 해석 가능성, (2) 사전 학습된 LLM을 활용한 전역적 일반화 능력, (3) 프로토타입 기반의 빠른 few‑shot 적응이라는 세 축을 결합함으로써 RF 지문 인식의 실용성을 크게 높였다
댓글 및 학술 토론
Loading comments...
의견 남기기