EM 기반 무참조 하드웨어 트로이 목마 탐지 흐름

EM 기반 무참조 하드웨어 트로이 목마 탐지 흐름
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 금형(golden) 레퍼런스나 라벨링된 데이터를 필요로 하지 않는 무참조, 설계 비종속형 EM 측정 흐름을 제안한다. 각 EM 트레이스를 연속파 변환(CWT)으로 시간‑주파수 스칼로그로 변환하고, VGG‑16 기반 CNN으로 특징을 추출한다. 추출된 고차원 특징은 주성분 분석(PCA)으로 차원을 축소한 뒤, 베이지안 가우시안 혼합 모델(BGMM)로 비지도 클러스터링한다. 클러스터링 결과와 베이지안 정보 기준(ΔBIC), 사후 신뢰도(αₚₒₛₜ, βₚₒₛₜ), 마할라노비스 거리(D) 등을 종합해 트리거형 하드웨어 트로이 목마(HT)의 존재 여부와 검증 신뢰도를 정량화한다. AES‑128 코어에 삽입된 네 종류의 HT에 대한 실험에서 높은 구분도와 PCA 분산 임계값에 대한 강인성을 보이며, 설계 정보 없이도 트리거 이벤트를 검출할 수 있음을 입증한다.

상세 분석

이 연구는 현대 반도체 공급망에서 금형 회로도나 라벨링된 데이터가 확보되지 않는 상황을 전제로, EM 사이드채널을 활용한 무참조 이상 탐지 프레임워크를 설계하였다. 핵심 아이디어는 개별 EM 파형을 연속파 변환(CWT)으로 시간‑주파수 스칼로그로 변환함으로써, 짧고 희귀한 트리거 이벤트가 발생하는 순간의 주파수 에너지 변화를 시각적으로 강조하는 것이다. CWT는 스케일에 따라 시간·주파수 해상도가 자동 조정되므로, 디지털 스위칭 노이즈와 고조파가 혼재하는 복잡한 EM 환경에서도 트로이 목마가 유발하는 순간적인 비정상 패턴을 포착한다.

스칼로그를 2차원 이미지 형태로 입력받은 뒤, VGG‑16 기반 합성곱 신경망(CNN)으로 특징을 추출한다. 여기서 저자는 전이 학습을 활용해 초기 레이어를 고정하고, 후반부 레이어를 비지도 자기지도(pretext) 학습(예: 회전 예측)으로 미세조정함으로써, 라벨이 없는 데이터에서도 트리거 특유의 텍스처와 에너지 패턴을 학습하도록 설계하였다. 결과적으로 512 차원의 고차원 특징 벡터가 생성되며, 이는 전통적인 손수 설계한 통계량보다 EM 신호의 미세 변동을 더 잘 포착한다.

다음 단계에서는 주성분 분석(PCA)으로 차원을 축소한다. 저자는 전체 분산의 90 %를 보존하는 최소 차원을 선택하고, 각 주성분에 분산 기여도 가중치를 곱한 가중합을 통해 1차원 디스크립터를 만든다. 이는 클러스터링 단계에서 차원의 저주와 과적합을 방지하고, 혼합 모델의 수렴성을 높이는 역할을 한다.

베이지안 가우시안 혼합 모델(BGMM)은 사전 디리클레(Dirichlet) 분포를 이용해 불필요한 컴포넌트를 자동으로 억제한다. 이는 트리거 이벤트가 전체 트레이스의 2‑5 % 수준으로 희귀할 때, 정상 데이터가 다중 가우시안으로 과도하게 분할되는 현상을 완화한다. 모델은 각 클러스터의 혼합 가중치(π), 사후 책임(rᵢₖ), 그리고 샘플 로그 가능도 등을 제공한다.

클러스터링 결과를 해석하기 위해 저자는 두 단계의 검증을 수행한다. 첫째, 가장 큰 혼합 가중치를 가진 클러스터를 “정상”으로 정의하고, 둘째, 부차 클러스터가 전체 비중 2‑5 % 이하이면서 마할라노비스 거리 또는 Bhattacharyya 거리로 정상 클러스터와 충분히 구분되는지를 확인한다. 이러한 검증을 통과한 경우에만 비정상(HT)으로 판단하고, 사후 신뢰도 αₚₒₛₜ(정상)와 βₚₒₛₜ(비정상) 를 계산한다. αₚₒₛₜ와 βₚₒₛₜ는 각각 정상 클러스터에 속할 확률의 평균과 비정상 클러스터에 속할 확률의 평균으로 정의된다.

결정 기준은 ΔBIC(베이지안 정보 기준 차이)와 βₚₒₛₜ, 그리고 마할라노비스 거리 D를 조합한다. ΔBIC ≥ 10이면 다중 모달리티가 통계적으로 유의하다고 판단하고, βₚₒₛₜ ≥ 0.30이면 고신뢰도 HT 의심, 0.20 ≤ βₚₒₛₜ < 0.30이면 중간 신뢰도, 그 이하이면 비의심으로 분류한다. D ≥ χ²₀․₉₉(p) ≈ 3이면 클러스터 간 구분이 충분히 명확하다고 본다.

실험에서는 ChipWhisperer 기반 FPGA에 AES‑128 코어를 구현하고, 네 종류의 트리거형 HT(키 누출 HT#1, 변형 HT#2, DoS HT#3, 변형 HT#4)를 삽입하였다. EM 프로브(1.25 mm)와 500 MS/s 오실로스코프를 이용해 수천 개의 트레이스를 수집하고, 제시된 파이프라인을 적용하였다. 결과는 HT가 활성화된 경우와 비활성화된 경우 사이에 스칼로그 에너지 분포가 뚜렷이 달라짐을 보여주며, PCA 분산 임계값을 80 %에서 95 %까지 변화시켜도 ΔBIC와 βₚₒₛₜ 값은 일관되게 높은 구분력을 유지한다. 특히, HT#1과 HT#2는 CDMA 기반 키 누출 패턴이 여러 클럭 사이클에 걸쳐 분산되므로, 전통적인 전압/전류 측정보다 EM‑CWT‑CNN 조합이 더 민감하게 탐지한다는 점을 강조한다.

이 프레임워크의 장점은 (1) 설계 파일이나 금형 회로가 전혀 없어도 적용 가능, (2) 비지도 학습으로 라벨링 비용을 제거, (3) 시간‑주파수 분석과 딥러닝 특징 추출을 결합해 희귀 이벤트를 효과적으로 포착, (4) 베이지안 모델링을 통해 검출 신뢰도를 정량화한다는 점이다. 반면, 고품질 EM 측정 장비와 프로브 위치 최적화가 필요하며, 트리거 이벤트가 극히 드물 경우 충분한 통계적 샘플을 확보해야 한다는 실용적 제약이 존재한다. 또한, BGMM이 정상 데이터 내에서도 다중 클러스터를 형성할 가능성이 있어, 클러스터 검증 기준의 민감도 조정이 중요하다.

전반적으로 이 연구는 금형 레퍼런스가 불가능한 포스트‑실리콘 단계에서 트리거형 하드웨어 트로이 목마를 탐지할 수 있는 실용적인 무참조 방법론을 제시하며, 향후 런타임 모니터링 및 현장 보안 검증으로 확장될 가능성을 열어준다.


댓글 및 학술 토론

Loading comments...

의견 남기기