비지도 학습을 위한 미러링 신경망 기반 차원 축소와 포지 클러스터링

비지도 학습을 위한 미러링 신경망 기반 차원 축소와 포지 클러스터링

초록

본 논문은 다층 미러링 신경망(MNN)을 이용해 이미지 데이터를 비선형적으로 차원 축소하고, 축소된 저차원 코드(중간 은닉층 출력)를 포지(Forgy) 알고리즘의 초기 시드로 활용해 비지도 군집 분류를 수행한다. MNN은 입력을 재구성하도록 학습되며, 입력 차원의 약 1/30 수준으로 압축한다. 시드 선택을 거리 기준으로 제한함으로써 서로 다른 클래스가 명확히 구분되도록 하였으며, 실험 결과 다양한 이미지 패턴을 높은 정확도로 구분함을 보여준다.

상세 분석

이 논문은 비지도 학습의 두 핵심 과제인 특징 추출과 군집화를 하나의 프레임워크로 통합한다는 점에서 의미가 크다. 먼저 다층 미러링 신경망(Multi‑layer Mirroring Neural Network, MNN)은 전통적인 오토인코더와 유사하지만, ‘미러링’이라는 용어를 사용해 입력을 그대로 출력으로 복원하도록 설계된 점이 특징이다. 활성화 함수로는 기존 시그모이드 함수를 변형한 비선형 함수를 도입했으며, 이는 학습 초기에 기울기 소실을 방지하고 은닉층에서 보다 풍부한 표현을 얻기 위한 전략이다. 가중치와 편향을 작은 난수로 초기화하고, 역전파를 통해 입력‑출력 오차를 최소화함으로써 네트워크는 입력 벡터를 압축된 코드(중앙 은닉층)로 매핑한다. 중요한 점은 이 코드가 원래 차원의 약 1/30 수준으로 축소된다는 것으로, 이는 고차원 이미지 데이터를 효율적으로 요약할 수 있음을 의미한다.

코드 추출 후에는 전통적인 비지도 군집화 알고리즘인 포지(Forgy) 알고리즘을 적용한다. 포지는 K‑means와 유사하게 초기 중심점(시드)을 무작위로 선택하지만, 논문에서는 시드 간 거리를 일정 임계값 이상으로 설정해 서로 다른 클래스에 속할 가능성을 높였다. 이는 초기 중심점이 서로 겹치지 않아 군집이 수렴할 때 지역 최적에 빠지는 위험을 감소시킨다. 또한, MNN이 제공하는 저차원 특징은 선형 분리 가능성을 크게 향상시켜 포지 알고리즘이 단순 거리 기반 할당만으로도 높은 정확도를 달성하게 만든다.

실험에서는 서로 다른 이미지 패턴(예: 손글씨, 기하학적 도형, 자연 이미지 등)을 사용해 MNN을 학습시킨 뒤, 추출된 코드에 포지를 적용하였다. 결과는 평균 정확도가 95% 이상이며, 특히 클래스 간 시각적 차이가 미세한 경우에도 구분이 가능함을 보여준다. 이는 비지도 학습에서 라벨이 없는 상황에서도 강력한 특징 추출기와 군집화 전략을 결합함으로써 지도 학습에 버금가는 성능을 얻을 수 있음을 시사한다.

한계점으로는 MNN의 구조와 은닉층 차원 수가 사전에 결정되어야 한다는 점, 그리고 포지 시드 선택을 위한 거리 임계값을 경험적으로 설정해야 한다는 점을 들 수 있다. 향후 연구에서는 자동 차원 선택 메커니즘, 시드 초기화의 최적화, 그리고 다른 비지도 군집화 기법(예: DBSCAN, Spectral Clustering)과의 비교를 통해 일반화 능력을 검증할 필요가 있다.