확산 모델 기반 복제 탐지 패턴 인증 프린터 서명 조건화 멀티모달 프레임워크
초록
본 논문은 복제 탐지 패턴(CDP)의 진위 판별을 위해 원본 이진 템플릿, 인쇄된 CDP, 프린터 서명 텍스트를 동시에 활용하는 확산 기반 멀티모달 프레임워크를 제안한다. 프린터를 다중 클래스 라벨로 정의하고, ControlNet을 변형해 클래스별 노이즈 예측을 수행함으로써 프린터 식별 정확도를 높이고, 미지의 위조 유형에도 일반화한다. Indigo 1×1 Base 데이터셋에서 기존 유사도 기반 및 딥러닝 방법을 능가하는 성능을 보였다.
상세 분석
이 연구는 CDP 인증 문제를 “프린터 식별 → 진위 판별”이라는 두 단계로 재구성하고, 이를 하나의 확산 모델 안에서 동시에 해결한다는 점에서 혁신적이다. 기존 방법들은 템플릿‑기반 유사도(NCC, SSIM)나 프린터‑전용 특징을 별도로 학습했지만, 본 논문은 템플릿, 인쇄 이미지, 프린터 설명 텍스트를 동일한 잠재공간에 인코딩한다. 확산 과정에서 템플릿을 단계별 가우시안 노이즈에 노출시킨 뒤, 역확산 단계에서 프린터 텍스트 임베딩과 인쇄 CDP 이미지 라텐트를 조건으로 사용한다. ControlNet의 이미지‑조건화 브랜치를 그대로 차용하면서, 각 클래스마다 별도 노이즈 예측 헤드를 두어 클래스별 손실을 계산한다. 최종 클래스는 “예측 노이즈와 실제 노이즈 사이의 L2 오차가 최소인 클래스”로 선택되며, 이는 기존 diffusion classifier(DDIM‑based)와 유사하지만, 텍스트와 이미지 조건을 동시에 활용한다는 점이 차별점이다. 학습 시 다중 프린터 데이터를 이용해 프린터 고유의 미세한 변형(노즐 진동, 잉크 점도 등)을 학습하고, 테스트 시에는 동일 프린터가 아닌 경우 높은 오차를 보이게 함으로써 위조를 탐지한다. 실험에서는 10여 대의 프린터와 여러 위조 알고리즘(전통 이미지 처리, GAN, Diffusion 기반 위조)을 포함한 데이터셋에서 정확도, F1‑score 모두 기존 Siamese‑Net, U‑Net, Pix2Pix 기반 방법을 크게 앞섰다. 또한, 클래스 미포함 위조(훈련에 없는 위조 유형)에서도 안정적인 판별을 보여 일반화 능력이 뛰어나다. 한계점으로는 텍스트 프린터 설명이 사전 정의돼야 하며, 새로운 프린터가 추가될 때 텍스트 라벨링과 재학습이 필요하다는 점이다. 또한, 확산 모델의 연산 비용이 높아 실시간 인증에는 최적화가 요구된다.
댓글 및 학술 토론
Loading comments...
의견 남기기