바운딩 박스 기반 확산 모델로 산업 결함 이미지와 라벨 자동 생성

바운딩 박스 기반 확산 모델로 산업 결함 이미지와 라벨 자동 생성
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 산업 현장의 결함 세그멘테이션을 위해, 저비용의 바운딩 박스 주석만으로 고품질 RGB 이미지와 정확한 마스크를 동시에 생성하는 확산 기반 파이프라인을 제안한다. 풍부한 거리·클래스 정보를 담은 두 종류의 바운딩 박스 인코딩(BASD, C‑BASD)을 조건으로 사용해 기존 레이아웃‑조건 생성 모델보다 결함 위치 정합성과 시각적 품질을 크게 향상시켰으며, 새롭게 정의한 SAE와 EBR 지표로 정량적 우수성을 입증한다.

상세 분석

이 연구는 산업용 결함 데이터의 라벨링 비용을 크게 낮추면서도 높은 정확도를 유지하기 위해, 조건부 확산 모델에 특수한 바운딩 박스 표현을 결합한다. 기존의 one‑hot 혹은 텍스트‑조건 방식과 달리, 저자들은 각 픽셀에 대해 최소 거리와 부호를 포함하는 Signed Distance Map(BASD)과, 해당 거리값이 양수인 영역에 클래스 정보를 비트 형태로 인코딩한 C‑BASD를 생성한다. 이러한 두 채널을 RGB와 아날로그 비트 형태의 세그멘테이션 맵과 함께 UNet 기반 DDPM에 입력함으로써, 노이즈 제거 과정에서 공간적·구조적 제약을 강력히 반영한다. 학습 목표는 노이즈 예측 손실을 최소화하는 것이며, 1000 스텝의 역확산을 통해 최종적으로 (이미지, 마스크) 쌍을 출력한다. 실험에서는 목재 결함 데이터셋을 사용해, 기존 레이아웃‑조건 모델


댓글 및 학술 토론

Loading comments...

의견 남기기