무한 텐서 분해와 비모수 베이지안 모델

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

InfTucker는 텐서의 Tucker 분해를 무한 차원의 특징 공간으로 확장한 비모수 베이지안 프레임워크이다. 잠재 가우시안·t 프로세스를 이용해 복잡한 비선형 상호작용을 모델링하고, 연속형·이진형 데이터, 결측값, 잡음·이상치까지 모두 확률적으로 처리한다. 효율적인 변분 EM 알고리즘과 Kronecker 구조 활용으로 시간·공간 복잡도를 크게 낮추었으며, 화학 데이터와 소셜 네트워크 실험에서 기존 HOSVD·Weighted‑CP·비음수 텐서 분해보다 높은 예측 정확도를 보였다.

상세 분석

InfTucker 논문은 기존 Tucker·CP 분해가 갖는 선형성 한계를 비모수 베이지안 접근으로 극복한다는 점에서 학술적 의의가 크다. 핵심 아이디어는 각 모드의 인자 행렬 U^(k)를 무한 차원의 특징 맵 φ(·)에 투사하고, 무한 코어 텐서 W를 잠재 가우시안 프로세스(GP) 혹은 t‑프로세스(tP)로 사전 지정한다는 것이다. 이렇게 하면 M = W × φ(U) 라는 형태의 무한 Tucker 분해가 정의되며, W를 적분하면 M 자체가 다중선형 커널을 갖는 텐서‑변량 GP/tP가 된다.

모델은 두 가지 관측 모델을 제공한다. 연속형 데이터는 Gaussian likelihood, 이진 데이터는 probit likelihood를 사용한다. probit 경우 Albert‑Chib 데이터 증강을 도입해 이산 관측을 연속형 잠재 변수 Z와 연결하고, t‑프로세스는 스케일 변수 η를 Gamma 분포로 혼합함으로써 잡음에 대한 강건성을 확보한다.

학습은 변분 EM으로 수행된다. E‑step에서는 Z, M, η의 완전 factorized 변분 분포 q를 최적화하고, M의 변분 분포는 다변량 정규분포 N(μ,Υ) 형태로 얻어진다. 여기서 Υ는 (E

무한 텐서 분해와 비모수 베이지안 모델

초록

상세 분석

댓글 및 학술 토론

의견 남기기