연속 학습을 위한 대규모 일반화 이상 탐지 벤치마크 Continual‑MEGA
초록
Continual‑MEGA는 기존 이상 탐지 데이터셋에 새로 만든 ContinualAD를 결합해 규모와 다양성을 크게 확대한 연속 학습 벤치마크이다. 표준 연속 학습과, 연속 적응 후 보지 않은 클래스에 대한 제로샷 일반화를 평가하는 두 가지 시나리오를 제공한다. 논문은 경량 어댑터와 특징 합성을 이용한 ADCT라는 베이스라인을 제안하고, 기존 방법들이 픽셀‑레벨 결함 위치 추정에서 크게 뒤처져 있음을 실험을 통해 보여준다.
상세 분석
본 논문은 이상 탐지(Anomaly Detection, AD) 분야에서 ‘연속 학습(Continual Learning, CL)’과 ‘연속 제로샷 학습(Continual Zero‑Shot Learning, CZSL)’을 동시에 다룰 수 있는 평가 프레임워크를 최초로 제시한다. 기존 AD 벤치마크(MVTec‑AD, VisA 등)는 클래스 수와 이미지 다양성이 제한돼 실제 공장·현장 환경의 데이터 흐름을 충분히 모사하지 못한다는 점을 지적하고, 이를 보완하기 위해 30개의 객체 카테고리와 30,000여 장의 정상·결함 이미지로 구성된 ContinualAD를 자체 수집하였다. 이 데이터는 10종류의 촬영 기기와 다양한 결함 유형(균열, 오염, 긁힘 등)을 포함해 픽셀‑레벨 마스크까지 제공함으로써, 도메인 변이와 intra‑class 변동성을 크게 확대한다.
벤치마크 구성은 세 가지 시나리오로 나뉜다. Scenario 1은 기존 데이터셋을 베이스(85클래스)와 신규(5·10·30클래스)로 나누어 순차적 학습을 수행한다. Scenario 2는 베이스와 신규 모두에 MVTec‑AD·VisA를 제외하고, 이 두 데이터를 오직 제로샷 테스트용으로만 보관해 연속 적응 후 전혀 보지 않은 클래스에 대한 일반화 능력을 측정한다. Scenario 3은 ContinualAD를 제외하고 다른 공개 데이터만으로 연속 학습을 진행한 뒤, ContinualAD에 대해 제로샷 성능을 평가한다. 이렇게 설계된 평가 프로토콜은 (1) 연속 적응 과정에서의 망각 방지, (2) 새로운 도메인에 대한 즉시 일반화, (3) 데이터 규모·다양성이 모델 성능에 미치는 영향을 동시에 검증한다.
제안된 베이스라인 ADCT는 사전 학습된 CLIP(ViT‑B/16) 백본 위에 경량 MoE‑style 어댑터를 삽입하고, 정상 이미지 특징을 이용해 합성된 ‘이상 특징’ 벡터를 생성한다. 어댑터는 각 단계마다 소량의 파라미터만 업데이트해 과적합을 방지하고, 특징 합성은 기존 텍스트 프롬프트 기반 방법보다 더 풍부한 시각적 정보를 제공한다. 실험 결과, ADCT는 기존 최첨단 연속 AD 방법(Cao et al., 2024; Liu et al., 2024 등)보다 평균 AUROC·AP·pixel‑level IoU에서 2~5%p 향상을 기록했으며, 특히 제로샷 시나리오에서 기존 방법이 급격히 성능이 떨어지는 반면, ADCT는 비교적 안정적인 성능을 유지한다.
또한, 픽셀‑레벨 결함 위치 추정에서 대부분의 기존 방법이 낮은 IoU(≤0.3)를 보인 반면, ADCT는 0.45 이상의 IoU를 달성해 실제 현장 적용 가능성을 높였다. 이는 경량 어댑터가 기존 CLIP의 풍부한 시각 표현을 보존하면서도 도메인‑특화된 미세 조정을 가능하게 함을 의미한다. 마지막으로, ContinualAD를 포함한 전체 Continual‑MEGA 벤치마크가 없을 경우, 모델은 특히 제로샷 테스트에서 8~12%p 정도 성능 저하를 겪으며, 데이터 규모와 다양성이 연속 학습 모델의 일반화에 핵심적인 역할을 함을 재확인한다.
요약하면, 논문은 (1) 대규모·다양한 연속 AD 벤치마크를 제시, (2) 제로샷 일반화까지 포괄하는 두 단계 평가 프로토콜을 설계, (3) 경량 어댑터와 특징 합성을 결합한 ADCT 베이스라인을 통해 현존 방법들의 한계를 뛰어넘는 성능을 입증했다는 점에서 학계·산업계 모두에게 중요한 참고 자료가 될 것이다.
댓글 및 학술 토론
Loading comments...
의견 남기기