정규화된 강인 코딩을 이용한 얼굴 인식 혁신

초록

본 논문은 기존 SRC가 가정하는 잔차 분포와 높은 연산 비용을 개선하기 위해, 잔차와 계수를 독립적이고 동일하게 분포한다고 가정한 정규화 강인 코딩(RRC) 모델을 제안한다. 최대 사후 확률(MAP) 추정을 기반으로 한 IR3C 알고리즘을 통해 효율적으로 최적화하며, 다양한 occlusion·조명·표정 변형 상황에서 기존 희소 표현 기반 방법보다 뛰어난 정확도와 속도를 보인다.

상세 분석

RRC는 기존 SRC가 잔차를 l2‑norm(가우시안) 혹은 l1‑norm(라플라시안)으로 모델링하는 한계를 인식하고, 잔차와 코딩 계수를 각각 독립적인 확률 변수로 가정한다. 구체적으로 잔차는 무거운 꼬리를 갖는 분포(예: 스튜던트‑t)로, 계수는 가우시안 정규화(ℓ2)와 스파스성을 동시에 유도하는 라플라시안·가우시안 혼합 형태로 모델링한다. 이러한 사전·우도 설정을 통해 MAP 해를 구하면, 기존 ℓ1 최소화 문제 대신 가중치가 동적으로 조정되는 정규화된 최소제곱 형태가 도출된다.

IR3C 알고리즘은 이식 가능한 반복 재가중치 기법으로, 매 반복마다 현재 잔차와 계수의 추정값을 이용해 가중 행렬을 업데이트한다. 가중 행렬은 큰 잔차에 대해 낮은 가중치를, 작은 잔차에 대해 높은 가중치를 부여함으로써 외란에 대한 강인성을 확보한다. 동시에 계수에 대한 ℓ2 정규화는 해의 안정성을 보장하고, ℓ1‑like 가중치가 스파스성을 유지한다.

계산 복잡도 측면에서, RRC는 ℓ1 기반 최적화에 비해 선형 시스템 해결에 가까운 연산량을 요구한다. 특히 대규모 사전(수천 장)에서도 행렬 분해와 가중치 업데이트만으로 빠르게 수렴한다. 실험에서는 AR, Yale B, Extended Yale B, 그리고 occlusion‑augmented CMU PIE 등 4개 데이터셋에서 10%~~30% 수준의 무작위 손상, 블록 occlusion, 조명 변화, 표정 변형 등에 대해 기존 SRC, CRC, GSRC 등과 비교했을 때 평균 5~~12%p의 인식률 향상과 2~4배 빠른 처리 속도를 기록했다.

또한, RRC는 사전 학습 단계가 필요 없으며, 사전 자체가 손상된 경우에도 가중치 재조정으로 손실을 최소화한다. 이는 실시간 감시·모바일 인증 등 제한된 연산 자원을 가진 환경에서 실용성을 크게 높인다. 전체적으로 RRC는 확률 모델링과 효율적인 최적화 전략을 결합해, 강인 코딩과 정규화라는 두 축을 동시에 만족시키는 새로운 얼굴 인식 프레임워크라 할 수 있다.