생성 모델 기반 전역 강건성 검증

본 논문은 기존 검증이 제한된 검증 집합에만 적용되는 한계를 극복하고, GAN 등 생성 모델을 활용해 실제 데이터 분포를 근사한 대규모 샘플에 대해 신경망의 전역 강건성을 정의·검증한다. (ε, δ)‑전역 강건성 개념을 제시하고, 몬테카를로 샘플링과 로컬 강건성 검사 결합으로 실험적 평가 방법을 제안한다. 또한 현실적인 적대적 예시를 생성하는 알고리즘을 제시한다.

저자: Nathana"el Fijalkow, Mohit Kumar Gupta

본 논문은 신경망 검증 분야에서 기존의 로컬 강건성 검증이 갖는 근본적인 한계를 극복하고, 전역적인 강건성 사양을 정의·검증하는 새로운 패러다임을 제시한다. 현재 대부분의 검증 기법은 제한된 검증 집합, 즉 테스트 데이터셋에 포함된 몇 천 개의 이미지에 대해서만 ε‑볼트 내의 모든 변형이 올바르게 분류되는지를 확인한다. 이러한 접근은 데이터 분포 전체를 대표하지 못하고, 실제 서비스 환경에서 발생할 수 있는 다양한 입력에 대한 안전성을 보장하지 못한다는 비판을 받아 왔다. 이를 해결하기 위해 저자들은 생성 모델, 특히 GAN(Generative Adversarial Network)을 확률적 데이터 생성기로 활용한다. 생성 모델 G는 p‑차원 노이즈 x를 입력받아 d‑차원 이미지 G(x)를 출력한다. 노이즈는 표준 정규분포 N(0, 1)에서 샘플링되며, G는 학습 데이터의 분포를 근사하도록 훈련된다. 이렇게 생성된 이미지 집합은 실제 데이터와 매우 유사하다는 가정 하에, 신경망 분류기 C와 결합한 복합 네트워크 C∘G를 구성한다. 전역 강건성은 두 파라미터 (ε, δ) 로 정의된다. ε는 노이즈 공간에서 허용되는 최대 변동량이며, δ는 “실제와 같은 이미지가 생성될 확률”의 상한이다. 구체적으로, 모든 카테고리 c∈C에 대해 P_{x∼N(0,1)}

생성 모델 기반 전역 강건성 검증

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기