엣지 디바이스용 초경량 객체 탐지기 설계와 모델 압축 전략

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 엣지 디바이스에 적합한 경량 객체 탐지기를 만들기 위해 자동 채널 프루닝, 고정 채널 삭제, 지식 증류를 결합한 압축 파이프라인을 제안한다. ResNet‑50‑v1d 백본을 ImageNet에서 자동 프루닝·미세조정하여 압축하고, SSD‑300 구조에 적용해 모델 크기 16.3 MB, FLOPs 2.31 G, mAP 71.2를 달성하였다. 이는 기존 SSD‑300‑MobileNet보다 높은 정확도와 효율성을 보여준다.

상세 분석

이 연구는 엣지 환경에서 실시간 객체 탐지가 요구되는 상황을 고려해, 모델 크기와 연산량을 최소화하면서도 정확도 손실을 억제하는 압축 전략을 체계적으로 설계하였다. 핵심은 세 단계로 구성된 파이프라인이다. 첫 번째 단계인 자동 채널 프루닝은 백본인 ResNet‑50‑v1d의 각 레이어에서 중요도가 낮은 채널을 정량적으로 평가하고, 사전 정의된 압축 비율에 따라 선택적으로 제거한다. 중요도 평가는 BN 레이어의 γ 파라미터 절대값과 L1‑norm을 결합한 스코어링 방식으로, 이는 채널의 표현력과 학습 안정성을 동시에 반영한다. 프루닝 후에는 ImageNet 데이터셋을 이용해 전체 네트워크를 재학습(fine‑tuning)함으로써 손실된 표현력을 회복한다. 두 번째 단계인 고정 채널 삭제는 SSD‑300의 멀티스케일 헤드(branch layers)에서 구조적 제약을 고려해, 각 스케일별로 동일한 채널 수를 유지하도록 설계한다. 이는 하드웨어 구현 시 메모리 접근 패턴을 단순화하고, 파이프라인 병목을 최소화한다. 세 번째 단계인 지식 증류는 압축된 학생 모델이 원본 대형 모델(teacher)의 출력 로그잇(logits)와 중간 특징 맵을 모방하도록 유도한다. 여기서는 KL‑다이버전스와 L2 손실을 결합한 복합 손실 함수를 사용해, 클래스 예측 정확도와 위치 회귀 성능을 동시에 향상시킨다. 실험 결과, 제안된 압축 파이프라인은 모델 크기를 5배 이상 감소시키면서도 mAP 71.2라는 높은 성능을 기록했으며, 이는 동일한 입력 해상도와 연산량을 갖는 SSD‑300‑MobileNet( mAP 약 68)보다 우수하다. 또한 FLOPs 2.31 G는 실시간 추론(30 FPS 이상) 요구를 충족시키며, 메모리 제한이 심한 MCU·DSP 환경에서도 배치 가능함을 입증한다. 전체적으로 이 논문은 자동화된 구조 최적화와 효과적인 지식 전이 기법을 결합해, 엣지 디바이스용 경량 탐지기의 설계 패러다임을 제시한다.

엣지 디바이스용 초경량 객체 탐지기 설계와 모델 압축 전략

초록

상세 분석

댓글 및 학술 토론

의견 남기기