자동화된 철근 바 카운팅 및 중심 위치 추정을 위한 CNN‑DC 프레임워크
본 논문은 고해상도 산업 현장 이미지에서 철근 바의 개수를 정확히 세고 각 바의 중심점을 자동으로 찾는 두 단계 시스템을 제안한다. 첫 단계는 깊은 합성곱 신경망(CNN)으로 후보 중심점을 픽셀 단위로 분류하고, 두 번째 단계는 제안된 거리 클러스터링(DC) 알고리즘으로 후보들을 군집화해 최종 중심 위치와 바 개수를 추정한다. 실험 결과, 10장의 테스트 이미지에서 바 카운팅 정확도 99.26%, 중심점 평균 오프셋 4.1%를 달성했으며, 실시…
저자: Zhun Fan, Jiewei Lu, Benzhang Qiu
본 논문은 철근 바의 자동 카운팅 및 중심 위치 추정을 위한 새로운 프레임워크인 CNN‑DC를 제안한다. 철근 바는 건축 현장에서 핵심 재료로 사용되며, 생산 라인에서 바의 수량과 정확한 중심 위치를 파악하는 것은 자동화된 명판 용접 등 후속 공정에 필수적이다. 기존 연구들은 주로 템플릿 매칭, Sobel‑Hough 변환, Hough‑LoG, 컨투어 기반 방법 등을 활용했지만, 복잡한 산업 환경(조명 변화, 잡음, 바 겹침 등)에서 높은 파라미터 튜닝 비용과 낮은 견고성을 보였다.
이에 저자들은 두 단계 접근법을 설계하였다. 첫 단계는 깊은 합성곱 신경망(CNN)을 이용해 이미지 전역에서 후보 중심점을 픽셀 단위로 분류한다. 입력 패치는 71 × 71 크기로 설정했으며, 이는 평균 바 직경(71 px)과 일치한다. 네 개의 컨볼루션 레이어와 네 개의 맥스풀링 레이어, 세 개의 전결합 레이어로 구성된 네트워크는 TensorFlow 기반으로 구현되었고, L2 정규화와 0.001 학습률을 적용해 40 epoch 동안 SGD로 학습되었다. 데이터는 4장의 고해상도 이미지에서 추출한 99,195개의 패치(양성 26,468개, 음성 72,727개)로 구성했으며, 양성·음성 비율을 1:3으로 맞추어 불균형 문제를 완화하였다. 테스트 시에는 연산 효율성을 위해 스트라이드 6(픽셀당 약 0.4배)으로 슬라이딩 윈도우를 적용, 평균 3.6초 내에 한 이미지를 처리할 수 있었다.
두 번째 단계는 Distance Clustering(DC) 알고리즘이다. 후보 중심점들의 유클리드 거리를 모두 계산하고, 사전에 정의된 거리 임계값(th_d = 20) 이하인 점들을 초기 클러스터에 할당한다. 이후 클러스터 간 교집합이 존재하면 병합하고, 최종 클러스터마다 최소·최대 좌표의 평균을 취해 바의 실제 중심을 추정한다. 이 과정은 간단하면서도 바 간 일정한 간격을 활용해 정확한 군집화를 가능하게 한다.
실험은 10장의 이미지(1440 × 1080, RGB, 8‑bit) 중 4장을 학습, 6장을 테스트에 사용했다. 평가 지표는 Recall, Precision, F1-score, 상대적 정확도(Acc_r), 중심점 오프셋 비율(offset)으로 구성되었다. 결과는 Recall 0.9951, Precision 0.9976, F1 0.9963으로 거의 완벽한 검출 성능을 보였으며, 바 개수 추정 정확도는 99.26%, 평균 중심점 오프셋은 4.11%에 머물렀다. 이는 기존 방법들(템플릿 매칭, Sobel‑Hough, Hough‑LoG, 컨투어 기반)보다 현저히 높은 수치이며, 특히 조명 변화와 바 경계 흐림에 강인한 특성을 나타냈다.
파라미터 민감도 분석에서는 스트라이드와 th_d 값이 성능에 미치는 영향을 조사했다. 스트라이드 6(≈0.4)에서 가장 높은 Recall·Precision·F1와 최소 오프셋을 달성했으며, th_d를 20으로 설정했을 때 클러스터 과소·과다 병합을 방지하는 최적점을 찾았다.
한계점으로는 데이터셋 규모가 작고, 바가 원형이 아닌 경우나 복잡하게 겹친 상황에서 후보 중심점이 누락될 가능성이 있다. 또한 현재는 2D 이미지에만 적용되므로, 3D 포인트 클라우드나 다중 시점 영상에 대한 확장이 필요하다. 향후 연구에서는 다중 스케일 CNN, 시계열 영상 기반 추적, 그리고 강화 학습을 통한 파라미터 자동 튜닝 등을 도입해 보다 일반화된 솔루션을 개발하고, 실시간 공정 제어 시스템에 직접 연동하는 방안을 모색할 예정이다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기