프롬프트로 구현하는 지속적 조합 영샷 학습
읽는 시간: 2 분
...
📝 원문 정보
- Title: Prompt-Based Continual Compositional Zero-Shot Learning
- ArXiv ID: 2512.09172
- 발행일: 2025-12-09
- 저자: Sauda Maryam, Sara Nadeem, Faisal Qureshi, Mohsen Ali
📝 초록 (Abstract)
본 논문은 시각‑언어 모델(VLM)을 활용해 새로운 속성·객체·그 조합을 지속적으로 학습하면서 기존 지식을 망각하지 않는 방법을 제안한다. 기존 지속학습이 클래스가 서로 겹치지 않는다고 가정하는 반면, 조합 영샷 학습(CZSL)에서는 속성과 객체가 여러 세션에 걸쳐 재등장하고 조합만이 고유하기 때문에 더 복잡한 문제다. 고정된 VLM 백본 위에 프롬프트 기반의 PromptC‑CCZSL 프레임워크를 구축하고, 최신 세션에 가중치를 부여한 다중 교사(distillation) 방식을 통해 이전 지식을 보존한다. 세션‑인식 조합 프롬프트는 새로운 조합을 위한 다중모달 특징을 융합하고, 속성·객체 프롬프트는 세션‑무관하게 학습해 전역 의미 일관성을 유지한다. 또한, Cosine Anchor Loss(CAL)로 이전 지식을 고정하고, Orthogonal Projection Loss(OPL)로 새로운 속성·객체 임베딩이 기존 임베딩과 직교하도록 하여 중첩을 방지한다. Intra‑Session Diversity Loss(IDL)는 현재 세션 내 임베딩의 다양성을 촉진한다. 마지막으로, 망각 정도와 조합 일반화 능력을 동시에 평가하는 종합 프로토콜을 제시한다. UT‑Zappos와 C‑GQA 벤치마크 실험에서 PromptC‑CCZSL은 기존 VLM 기반·비‑VLM 기반 방법들을 크게 앞서며, 폐쇄형 환경에서 CCZSL의 새로운 기준을 제시한다.💡 논문 핵심 해설 (Deep Analysis)

이 논문은 이러한 구조적 특성을 반영해 세 가지 핵심 설계를 도입한다. 첫째, **프롬프트 기반…