스마트폰 사용자를 위한 무형 인증 딥 시계열 특징 활용
초록
본 논문은 스마트폰의 8가지 주요 센서 데이터를 이용해 사용자를 무형식으로 인증하는 방법을 제안한다. 시암쌍(LSTM) 네트워크로 시간적 특징을 추출하고, 각 모달리티별 임베딩을 점수 합산 방식으로 결합한다. 37명의 사용자를 15일간 수집한 30개 센서·6.7M 레코드 데이터셋에서 3초 이내에 0.1% 허위수락률(FAR) 하에 97.15% 진인식률(TAR)을 달성하였다.
상세 분석
본 연구는 스마트폰 사용자 인증을 명시적 입력(비밀번호·생체인식)에서 탈피하여, 사용자가 의식적으로 개입하지 않아도 되는 ‘패시브 인증’으로 전환하려는 시도이다. 이를 위해 30개의 센서 중 사용 빈도가 높고 데이터 품질이 우수한 8가지 모달리티(키스트로크 다이내믹스, GPS, 가속도계, 자이로스코프, 자력계, 선형 가속도계, 중력 센서, 회전 센서)를 선정하였다. 각 모달리티는 1 Hz(운동 센서) 혹은 이벤트 기반(키스트로크, GPS)으로 연속 수집되었으며, 15일 동안 37명의 사용자로부터 총 6.7 백만 개의 레코드를 확보하였다.
데이터 전처리 단계에서는 일정 길이(예: 3 초) 윈도우를 슬라이딩하여 시계열 샘플을 생성하고, 각 샘플을 정규화한 뒤 LSTM 입력으로 변환한다. 핵심 모델은 ‘시암쌍 LSTM’ 구조로, 두 개의 동일한 LSTM 네트워크가 각각 입력 쌍( genuine vs impostor )을 처리한다. LSTM은 시간적 의존성을 포착하여 고차원 특징을 추출하고, 최종 은닉 상태를 임베딩 벡터로 사용한다. 이 임베딩 간 유클리드 거리를 contrastive loss(또는 트리플렛 손실)로 학습함으로써 동일 사용자 샘플은 가깝게, 다른 사용자 샘플은 멀게 배치하도록 한다.
모달리티별로 학습된 시암쌍 모델은 독립적으로 점수를 산출한다. 본 논문은 점수 융합 단계에서 가장 단순하면서도 효과적인 ‘합산(score‑sum)’ 방식을 채택했으며, 이는 기존 연구에서 min, max, weighted‑sum 등과 비교해 높은 정확도를 보였다. 인증 판단은 사전 정의된 임계값(예: FAR = 0.1%) 이하일 경우 genuine 로 판정한다.
실험 결과는 인증 윈도우 길이에 따라 성능이 변함을 보여준다. 5 초 윈도우에서는 TAR = 99.80% (FAR = 0.1%)를 기록했으나, 실시간 사용성을 고려해 3 초 윈도우로 축소했을 때도 TAR = 97.15%를 유지하였다. 또한, 모달리티 수를 늘릴수록 성능이 점진적으로 향상되는 경향을 확인했으며, 8개 모달리티를 모두 결합했을 때 최적의 결과를 얻었다.
한계점으로는 사용자 수가 37명에 불과해 대규모 실환경 적용 시 일반화 가능성을 검증하기 어렵다는 점, 1 Hz 샘플링이 일부 고주파 움직임을 놓칠 가능성, 그리고 온디바이스 실시간 추론을 위한 연산량·전력 소모에 대한 상세 분석이 부족하다는 점을 들 수 있다. 향후 연구에서는 더 많은 사용자·다양한 OS 환경을 포함한 데이터셋 확대, 경량화된 시암쌍 모델 설계, 프라이버시 보호를 위한 차등 프라이버시 혹은 암호화된 임베딩 전송 방안 등을 탐색할 필요가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기