전방 인식 확산과 가속 샘플링을 통한 산업 이상 합성 혁신
초록
FAST는 전경(이상) 영역을 명시적으로 고려한 확산 모델과, 단계별 다중 역전파를 하나의 폐쇄형 업데이트로 압축하는 훈련‑무료 가속 샘플링(AIAS)을 결합한다. 전경‑인식 재구성 모듈(FARM)은 마스크된 이상 영역에 대한 노이즈를 지속적으로 조정해 합성 과정에서 이상 신호를 보존한다. 10단계만으로도 MVTec‑AD와 BT‑AD에서 기존 방법을 크게 앞서는 mIoU·Accuracy를 달성했으며, 코드가 공개되어 산업 현장의 빠른 데이터 증강에 활용 가능하다.
상세 분석
본 논문은 산업 현장에서 흔히 마주치는 “이상(Defect)” 데이터의 부족 문제를 해결하기 위해, 기존 확산 기반 합성 방법이 가지고 있던 세 가지 근본적인 한계를 정밀히 분석한다. 첫째, 기존 GAN‑기반 혹은 단순 패치 교체 방식은 이상의 형태·위치·크기를 자유롭게 제어하기 어렵다. 둘째, 훈련‑무료 방식은 시각적으로는 눈에 띄는 결함을 만들지만, 실제 산업 결함이 갖는 복합적인 구조적·텍스처적 특성을 충분히 재현하지 못한다. 셋째, 현재 확산 모델은 전·후방 과정 모두에서 이미지 전체를 균일하게 처리해, 이상 영역과 정상 배경 사이의 통계적 차이를 무시한다. 이러한 점은 합성된 결함이 역전파 과정에서 점차 희석돼 최종 이미지에 약해지는 현상을 초래한다.
FAST는 이러한 문제점을 두 개의 핵심 모듈로 해결한다. **AIAS(Anomaly‑Informed Accelerated Sampling)**는 전통적인 DDPM의 수천 단계 역전파를 “코스‑투‑파인” 구간으로 나누어, 각 구간을 하나의 선형‑가우시안 변환으로 대체한다. 논문은 ˆx₀(예측된 클린 이미지)가 구간 내에서 거의 변하지 않는다는 가정 하에, Lemma 1·2를 통해 다중 단계 전이를 폐쇄형 형태(Π, Σ, ε)로 정리한다. 이로써 사전 계산된 스칼라 계수를 이용해 10~20 단계만으로도 원래 1000 단계와 동등한 품질을 얻는다. 중요한 점은 이 과정이 훈련‑무료이며, 기존 LDM(잠재 확산 모델)의 파라미터를 그대로 재사용한다는 것이다.
두 번째 모듈인 **FARM(Foreground‑Aware Reconstruction Module)**은 마스크 M을 이용해 현재 시점 t의 노이즈 라티스 xₜ에서 이상 전용 부분을 추출하고, 이를 다시 전방 확산 과정을 통해 “이상‑인식 노이즈” ˆxₜ 로 변환한다. 이렇게 변환된 라티스는 역전파 단계에서 다시 사용돼, 이상 영역의 신호가 샘플링 전 과정에 걸쳐 유지된다. FARM은 두 가지 손실을 최적화한다. 첫째, 마스크된 영역에서 원본 이미지와 재구성 이미지 간 L2 차이를 최소화해 이상 구조를 정확히 복원한다. 둘째, 전체 이미지에 대한 노이즈 예측 손실을 유지해 전반적인 이미지 품질을 보존한다. 실험 결과, FARM을 적용하지 않은 경우 mIoU가 65% 수준에 머물렀으나, 적용 후 76% 이상으로 크게 상승한다.
이론적 근거와 실험적 검증을 모두 제공함으로써, FAST는 (1) 샘플링 효율성(>100× 가속), (2) 이상 영역의 지속적 보존, (3) 높은 합성 품질이라는 세 축을 동시에 만족한다. 또한, 마스크 기반 제어를 통해 사용자는 결함의 형태·위치·크기를 자유롭게 지정할 수 있어, 실제 생산 라인에서 요구되는 맞춤형 데이터 증강에 최적화돼 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기