스마트 주차장 현장 인식과 디지털 트윈 통합을 위한 엣지 기반 YOLOv11 솔루션

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 대학 캠퍼스 주차장을 대상으로, 경량화된 YOLOv11m‑TFLite 모델을 라즈베리파이 엣지 디바이스에서 실시간으로 구동하고, 거리 기반 매칭과 Adaptive Bounding Box Partitioning을 통해 개별 주차구역의 점유 여부를 98.8%의 균형 정확도로 판별한다. 또한 디지털 섀도우를 구현하고, 재활용 TV‑박스를 애플리케이션 지원 서버로 활용함으로써 비용 절감과 지속가능성을 동시에 달성한다.

상세 분석

이 연구는 기존의 차량 수 기반 전체 가용 공간 추정 방식에서 한 걸음 나아가, 개별 주차구역(spot‑wise) 수준의 점유 정보를 제공한다는 점에서 의미가 크다. 핵심 기술은 세 가지로 요약된다. 첫째, 모델 선택이다. 최신 YOLOv11m을 TFLite 포맷으로 변환해 40.5 MB 크기의 경량 모델을 라즈베리파이 4B에 탑재했으며, 추론 시간 8 초라는 제한된 연산 자원에서도 실시간에 가까운 성능을 유지한다. 둘째, 검출 후 처리 방식이다. 기존 연구들은 차량 마스크와 사전 정의된 주차좌표의 겹침을 50 % 이상일 때만 점유로 판단했지만, 작은 위치 오차에 취약했다. 여기서는 각 검출 객체의 중심점과 모든 주차구역 중심점 사이의 유클리드 거리를 계산하고, 사전 설정된 거리 임계값 이내에서 가장 가까운 구역에 매핑한다. 이 거리‑기반 매칭은 공간적 관용성을 제공해 카메라 시점 변화나 차량 위치 미세 변동에 강인하게 작동한다. 셋째, 어려운 구역을 위한 Adaptive Bounding Box Partitioning이다. 주차선이 흐릿하거나 구역이 비대칭인 경우, 기존 고정 ROI 방식으로는 검출 정확도가 떨어지는데, 이 방법은 이미지 내에서 자동으로 최적의 서브‑ROI를 생성해 각 구역에 맞는 크기의 바운딩 박스를 동적으로 할당한다. 결과적으로 전체 시스템은 98.80 %의 균형 정확도와 8 초 추론 시간을 달성했으며, 이는 동일 조건의 기존 YOLOv5·v8 기반 솔루션보다 현저히 우수하다.

또한 디지털 트윈(Digital Twin) 개념을 단계적으로 도입한다. 초기 단계인 디지털 섀도우(Digital Shadow)는 물리적 주차장의 상태를 일방향으로 복제해 시각화하고, NGSI‑LD 기반 스마트 데이터 모델을 활용해 다른 스마트 시티 서비스와 연동 가능하도록 설계되었다. 향후 양방향 통신을 추가해 완전한 디지털 트윈으로 진화할 수 있는 토대를 마련한다.

시스템 아키텍처 측면에서 눈여겨볼 점은 재활용 TV‑박스를 애플리케이션 지원 서버로 활용한 것이다. TV‑박스는 저전력 ARM 기반 하드웨어로, 기존 클라우드 서버 대신 로컬 네트워크에서 MQTT·HTTP 브로커, 데이터베이스, 챗봇 인터페이스 등을 실행한다. 이를 통해 네트워크 지연을 최소화하고, 데이터 프라이버시를 강화하며, 전자 폐기물 감소라는 순환경제 효과도 얻는다.

전체적으로 이 논문은 엣지 AI, 공간 인식 알고리즘, 디지털 트윈, 그리고 하드웨어 재활용이라는 네 가지 최신 트렌드를 하나의 통합 솔루션으로 구현했다는 점에서 학술적·실용적 기여도가 높다. 다만 8 초 추론 시간은 여전히 실시간(≤1 초) 요구에 미치지 못하므로, 모델 압축·양자화, 하드웨어 가속기(NPU) 적용 등의 추가 최적화가 필요하다.

스마트 주차장 현장 인식과 디지털 트윈 통합을 위한 엣지 기반 YOLOv11 솔루션

초록

상세 분석

댓글 및 학술 토론

의견 남기기