산업 의료 이미지 이상 탐지를 위한 사이클 GAN 기반 접근

본 논문은 정상·비정상 이미지 모두를 활용해 사이클 일관성을 갖는 GAN(사이클‑GAN)을 학습시킨 뒤, 비정상 이미지를 정상 이미지로 변환하는 생성기를 이용해 재구성 오차를 이상 점수로 활용한다. 정상·비정상 모두를 학습에 포함시킴으로써 기존 자동인코더 기반 방법보다 더 정교한 복원을 달성하고, 특히 ‘거짓 부정 제로(Zero False Negative)’ 조건을 만족하도록 임계값을 조정한다. 산업용 PCB 검사와 의료 영상(CT·MRI) 등…

저자: Arnaud Bougaham, Valentin Delchevalerie, Mohammed El Adoui

산업 의료 이미지 이상 탐지를 위한 사이클 GAN 기반 접근
본 논문은 산업 및 의료 영상 분야에서의 이상 탐지 문제를 해결하기 위해 사이클 일관성을 갖는 GAN, 즉 Cycle‑GAN을 활용한 새로운 프레임워크를 제안한다. 전통적인 이상 탐지 방법은 정상 데이터만을 이용해 자동인코더나 GAN 기반 재구성 모델을 학습하고, 테스트 단계에서 재구성 오류가 큰 이미지를 이상으로 판단한다. 그러나 이러한 접근법은 비정상 데이터가 전혀 활용되지 않아, 모델이 비정상 패턴을 ‘어떻게’ 변환해야 하는지에 대한 정보를 전혀 얻지 못한다는 근본적인 한계가 있다. 저자는 이러한 한계를 극복하고자 정상(정상 이미지 집합 Y)과 비정상(비정상 이미지 집합 X) 두 도메인을 동시에 학습에 포함시킨다. Cycle‑GAN은 두 개의 조건부 GAN을 사이클 일관성 제약으로 연결한 구조로, G: X → Y와 F: Y → X 두 개의 생성기를 각각 비정상→정상, 정상→비정상 매핑을 학습한다. 판별기 D_Y와 D_X는 각각 Y와 X 도메인에 속하는 진짜 이미지와 생성된 가짜 이미지를 구분한다. 학습 과정에서 사용되는 손실 함수는 다음과 같다. - **적대적 손실(L_adv)**: 전통적인 GAN 손실로, G와 D_Y, F와 D_X가 서로 경쟁하며 생성기가 목표 도메인과 구분이 어려운 이미지를 만들도록 유도한다. - **사이클 일관성 손실(L_cyc)**: G와 F가 순차적으로 적용된 후 원본 이미지와 복원 이미지 사이의 L1 거리를 최소화한다. 이는 두 도메인 간 매핑이 역전 가능하도록 보장한다. - **정체성 손실(L_id)**: 입력 이미지가 이미 목표 도메인에 속할 경우, 변형을 최소화하도록 강제한다. 즉, 정상 이미지가 G에 입력되면 거의 변하지 않아야 하고, 비정상 이미지가 F에 입력되면 역시 변하지 않아야 한다. 이 손실은 특히 이상 탐지에서 중요한 역할을 한다. 정상 이미지가 G에 의해 불필요하게 변형되면 재구성 오류가 증가해 거짓 양성(False Positive)이 늘어날 위험이 있기 때문이다. 학습이 완료된 후, 테스트 단계에서는 오직 G(비정상→정상 변환기)만을 사용한다. 입력 이미지가 정상인지 비정상이든 G를 통과시켜 재구성된 이미지를 얻고, 원본 이미지와 재구성 이미지 사이의 차이를 이상 점수로 정의한다. 두 가지 점수 방식을 제안한다. 첫 번째는 픽셀 단위의 제곱 오차 합(SSE)이며, 두 번째는 사전 학습된 Inception‑V3 네트워크를 이용해 이미지의 고차원 특징 분포 차이를 측정하는 Frechet Inception Distance(FID)이다. FID는 인간이 인지하는 시각적 차이를 더 잘 반영한다는 장점이 있다. 임계값 설정은 두 가지 전략으로 진행된다. (1) 전체 정확도(ACC)를 최대화하는 임계값, (2) 모든 실제 이상을 놓치지 않도록 설계된 ‘거짓 부정 제로(Zero False Negative, ZFN)’ 임계값. ZFN 임계값은 특히 산업 현장이나 의료 진단처럼 놓친 결함이 큰 비용이나 위험을 초래하는 상황에 적합하다. 실험은 7개의 데이터셋을 대상으로 수행되었다. 산업 분야에서는 전자 부품 조립(PCB) 이미지, 기계 부품 결함 이미지 등을 사용했으며, 의료 분야에서는 CT와 MRI 스캔 이미지가 포함되었다. 각 데이터셋은 작은 객체형 결함(예: 나사 머리 파손)부터 큰 텍스처형 결함(예: 조직 변형)까지 다양한 형태의 이상을 포함한다. 비교 대상으로는 기존의 오토인코더 기반 재구성 모델, 변형 GAN, Patch‑based 통계 모델, 그리고 최근의 f‑AnoGAN 등이 포함되었다. 결과는 다음과 같다. 제안된 Cycle‑GAN 기반 방법은 모든 데이터셋에서 기존 최첨단 방법보다 높은 AUC‑ROC 값을 기록했으며, 특히 ZFN 설정에서는 기존 방법이 놓치는 작은 결함을 거의 모두 탐지하였다. 정체성 손실을 제외한 버전과 비교했을 때, 재구성 이미지의 노이즈가 크게 증가하고 이상 점수 분포가 겹쳐져 탐지 성능이 현저히 저하되는 것을 확인하였다. 또한, 비정상 데이터를 학습에 활용함으로써 정상 생성기(G)의 품질이 향상되어, 정상 이미지에 대한 재구성 오류가 최소화되었다. 논문의 주요 기여는 다음과 같다. 1. **비정상 데이터를 학습에 적극 활용**: 기존 비지도 학습의 한계를 넘어, 비정상 샘플을 이용해 두 도메인 간 매핑을 명시적으로 학습한다. 2. **정체성 손실을 AD에 최적화**: 정상 이미지가 변형되지 않도록 강제함으로써 재구성 오류를 최소화하고, 거짓 양성을 억제한다. 3. **ZFN 임계값 설정**: 산업·의료 현장에서 놓치는 것이 치명적인 상황에 맞는 임계값 전략을 제시한다. 4. **다양한 도메인에 대한 포괄적 벤치마크**: 산업과 의료 두 분야에서 7개의 데이터셋을 사용해 광범위하게 검증하였다. 마지막으로, 코드와 학습 파라미터가 공개되어 재현 가능성을 높였으며, 향후 연구에서는 비정상 데이터가 더욱 희소한 상황에서의 샘플 효율성 향상, 그리고 실시간 적용을 위한 경량화 모델 설계가 제안된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기