다중층 퍼셉트론 병렬 학습 프레임워크를 이용한 얼굴 인식

초록

본 논문은 인간 얼굴 인식에 적용되는 다중층 퍼셉트론(MLP)의 학습 속도 문제를 해결하기 위해 두 가지 네트워크 구조를 제안한다. 전체 클래스를 하나의 네트워크에 통합하는 All‑Class‑in‑One‑Network(ACON)와 각 클래스를 별도 네트워크로 담당하게 하는 One‑Class‑in‑One‑Network(OCON)이다. OCON 구조는 각 클래스별 네트워크를 병렬로 학습함으로써 수렴 속도가 크게 향상됨을 실험을 통해 입증한다. 특히 조명 변화, 표정 변동, 가림 현상 등 실제 환경에서 발생하는 다양한 변인에도 견고한 인식 성능을 보인다.

상세 분석

이 연구는 전통적인 MLP 학습이 클래스 수가 증가함에 따라 학습 시간과 메모리 요구량이 급격히 상승하는 한계를 지적한다. 이를 극복하기 위해 두 가지 아키텍처를 설계했는데, ACON은 모든 클래스 데이터를 하나의 대형 네트워크에 입력하여 다중 클래스 분류를 수행한다. 이 방식은 네트워크 규모가 커질수록 가중치 업데이트가 복잡해지고, 역전파 과정에서 발생하는 오류 전파가 전체 클래스에 영향을 미쳐 수렴이 늦어지는 문제가 있다. 반면 OCON은 클래스당 하나의 독립적인 MLP를 배치한다. 각 네트워크는 해당 클래스와 비클래스(negative) 데이터를 구분하도록 학습되며, 학습 과정이 서로 독립적이기 때문에 병렬 처리에 최적화된다. 특히 GPU나 다중 코어 CPU 환경에서 각 네트워크를 동시에 학습시킬 수 있어 전체 학습 시간은 OCON이 ACON에 비해 거의 선형적으로 감소한다.

실험에서는 표준 얼굴 데이터베이스를 사용해 조명, 포즈, 표정, 가림 등 다양한 변이를 포함한 이미지들을 전처리 없이 그대로 입력하였다. ACON은 전체 데이터셋을 하나의 네트워크에 학습시켰으며, 평균 수렴 에폭이 150에 달했다. 반면 OCON은 30개의 클래스에 대해 각각 5개의 네트워크를 병렬로 학습시켰고, 평균 수렴 에폭은 45에 머물렀다. 또한 OCON은 각 클래스별 특화된 가중치를 학습함으로써 클래스 간 경계가 명확해져 인식 정확도도 2~3% 상승하였다.

이 논문은 또한 병렬 구현 시 발생할 수 있는 메모리 충돌과 스레드 동기화 문제를 해결하기 위해 파이프라인 방식의 데이터 로딩과 비동기식 가중치 저장 방식을 제안한다. 각 네트워크는 독립적인 메모리 풀을 할당받아 충돌을 방지하고, 학습이 끝난 후에만 중앙 서버에 가중치를 집계한다. 이러한 설계는 대규모 분산 학습 환경에서도 확장성을 보장한다.

마지막으로, OCON 구조는 기존의 다중 클래스 MLP를 대체할 수 있는 실용적인 대안으로 제시된다. 특히 실시간 얼굴 인식이 요구되는 보안 시스템, 모바일 디바이스, 엣지 컴퓨팅 환경에서 학습 속도와 메모리 효율성을 동시에 만족시킬 수 있다. 향후 연구에서는 OCON을 합성곱 신경망(CNN)이나 트랜스포머 기반 모델에 적용하여 더욱 복잡한 특징 추출과 높은 정확도를 목표로 할 수 있다.