생성적 얽힘을 통한 요인 분리 모델

본 논문은 스파이크‑앤‑슬랩 제한 볼츠만 머신(RBM)을 고차원 상호작용으로 확장해, 데이터 내 변이 요인을 자동으로 분리(disentangle)하는 새로운 모델을 제안한다. 곱셈적 상호작용을 통해 요인들을 “얽히게(entangle)” 하고, 역으로 추론 단계에서 이를 풀어내는 방식을 채택했으며, 감독 정보 없이 얼굴 표정 분류 과제에 적용해 유의미한 성능 향상을 보였다.

저자: Guillaume Desjardins, Aaron Courville, Yoshua Bengio

본 논문은 데이터 내부에 존재하는 여러 변이 요인을 명시적인 감독 없이도 자동으로 분리해내는 모델을 제안한다. 연구 배경으로는 인간이 인식하는 이미지가 조명, 자세, 감정 등 다양한 요인의 복합적 결합으로 이루어져 있다는 점을 들며, 이러한 요인들을 개별적으로 파악하는 것이 해석 가능하고 일반화 가능한 머신러닝 시스템 구축에 핵심이라고 주장한다. 기존 연구에서는 VAE, β‑VAE, InfoGAN 등 다양한 확률적 생성 모델이 요인 분리를 목표로 했지만, 대부분은 라벨이나 사전 정의된 구조에 의존하거나, 잠재 공간을 단순히 정규화하는 방식에 머물렀다. 모델 설계는 스파이크‑앤‑슬랩 제한 볼츠만 머신(RBM)을 기반으로 한다. 스파이크 변수 \(h\)는 이산형(0/1)으로 요인의 존재 여부를, 슬랩 변수 \(s\)는 연속형으로 요인의 강도를 나타낸다. 기존 RBM은 2‑차원 가중치 행렬으로 가시 변수와 잠재 변수 사이의 선형 상호작용을 모델링했지만, 저자는 여기서 다중 스파이크 그룹 \(\{h^{(1)}, h^{(2)}, \dots\}\)과 다중 슬랩 그룹 \(\{s^{(1)}, s^{(2)}, \dots\}\) 사이에 3‑차원 혹은 그 이상의 텐서 \(\mathcal{W}\)를 도입한다. 이 텐서는 곱셈적(gated) 형태로 작동해, 특정 스파이크 조합이 활성화될 때만 해당 슬랩이 가시 변수에 영향을 미치게 만든다. 수식적으로는 에너지 함수가 \

생성적 얽힘을 통한 요인 분리 모델

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기