바이오모방 교차주의 YOLO 기반 고정밀 소형 목표 탐지 및 안정 추적 시스템
초록
본 논문은 인간의 전정안구반사(VOR)와 동물의 시각 초점 메커니즘을 모방한 CA‑YOLO 모델과 바이오모방 팬‑틸트 제어 전략을 제안한다. MHSA와 소형 목표 검출 헤드, 특성 융합 주의 메커니즘(CFAM)을 도입해 COCO와 VisDrone에서 각각 3.94%·4.90%의 mAP 향상을 달성했으며, 실시간 팬‑틸트 시스템과 결합해 가변 속도·소형 목표를 안정적으로 추적한다.
상세 분석
CA‑YOLO는 기존 YOLOv8 구조에 세 가지 핵심 모듈을 삽입함으로써 소형 목표 검출과 전반적인 정확도를 동시에 끌어올린다. 첫 번째는 SPPF 뒤에 배치된 Multi‑Head Self‑Attention(MHSA)이다. MHSA는 전역적인 관계를 학습해 얕은 피처맵이 놓치는 미세한 텍스처와 경계 정보를 보강한다. 두 번째는 xSmall이라 명명된 소형 목표 검출 헤드로, 고해상도 피처맵을 별도 분기시켜 작은 객체의 위치와 클래스를 직접 예측한다. 이는 기존 대형 헤드가 얕은 레이어의 정보를 충분히 활용하지 못하던 문제를 해결한다. 세 번째는 기존 Concat 연산을 대체한 Characteristic Fusion Attention Mechanism(CFAM)이다. CFAM은 채널‑공간 주의를 동시에 적용해 서로 다른 스케일의 피처를 가중치 기반으로 융합함으로써, 배경 잡음이 심한 환경에서도 핵심 객체에 집중할 수 있게 한다.
네트워크 설계 외에도 논문은 인간의 VOR에서 영감을 얻은 팬‑틸트 제어 로직을 제시한다. 카메라‑컴퓨터‑STM32‑서보 구조를 인간의 망막‑전정핵‑안구핵‑외안근에 비유하고, 목표 중심 정렬, 안정성 최적화, 적응형 제어 계수 조정, 그리고 목표 손실 시 자동 재탐색 기능을 순차적으로 구현한다. 특히 적응형 제어 계수는 목표 속도와 가속도 변화를 실시간으로 추정해 PWM 신호를 동적으로 보정함으로써, 급격한 움직임이나 외부 진동에도 추적 오류를 최소화한다.
실험에서는 COCO와 VisDrone 데이터셋에 대해 기존 YOLOv8 대비 mAP가 각각 3.94%와 4.90% 상승했으며, FPS 저하 없이 실시간(>30 fps) 성능을 유지했다. Ablation study는 MHSA, xSmall, CFAM 각각이 독립적으로 mAP에 1.2~1.8% 기여함을 확인했다. 팬‑틸트 시스템은 0.03 rad 이하의 오프셋을 유지하며 15 m/s까지의 목표 속도 변화를 안정적으로 추적했으며, 목표가 시야를 벗어났을 때 0.8 s 내에 자동 재탐색에 성공했다.
전반적으로 CA‑YOLO는 주의 메커니즘과 소형 목표 전용 헤드를 결합해 작은 객체 검출의 한계를 크게 완화했으며, VOR 기반 제어와의 하드웨어‑소프트웨어 통합은 실제 로봇·드론 응용에서 실시간 안정 추적을 가능하게 한다. 다만, CFAM의 연산량이 약간 증가하고, 매우 저조도 환경에서의 성능 검증이 부족하다는 점은 향후 연구 과제로 남는다.
댓글 및 학술 토론
Loading comments...
의견 남기기