잠재변수 의미를 밝히는 라티트익스플레이너
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.
초록
**
라티트익스플레이너는 VAE·디퓨전 등 심층 생성 모델의 잠재변수를 자동으로 해석하기 위해, 잠재변수를 교란하고 생성된 이미지 시퀀스를 분석한 뒤, 멀티모달 대형 언어 모델(MLLM)에 프롬프트를 전달해 인간이 이해할 수 있는 텍스트 설명을 생성한다. 인덕티브 바이어스를 텍스트화하고 불확실성 정량화를 통해 설명의 신뢰성을 평가한다. 실험 결과, 기존 방법보다 더 정확하고 일관된 잠재변수 설명을 제공한다.
**
상세 분석
**
본 논문은 심층 생성 모델에서 잠재공간(z)의 의미를 해석하는 문제를 “잠재변수 의미 추론 → 인덕티브 바이어스 정렬 → 설명 가능성 정도 평가”라는 세 단계로 구조화한다. 첫 단계에서는 각 잠재변수 z_i 를 작은 범위(γ)로 교란하고, 교란 전후의 디코더 G 를 통해 이미지 시퀀스 S_i 를 생성한다. 이때 교란 방향은 모델이 학습한 잠재공간의 구조를 그대로 반영하도록 설계되며, 특히 디퓨전 모델에서는 ˜z = z + γ
댓글 및 학술 토론
Loading comments...
의견 남기기