대화 기억을 엮는 TraceMem: 사용자 대화 흔적로 서사 메모리 스키마 구축
초록
TraceMem은 대화형 LLM의 장기 기억 한계를 극복하기 위해, 사용자 대화 흐름을 에피소드 단위로 구분하고 의미 표현을 추출한 뒤, 에피소드를 요약·통합해 개인화된 경험 흔적을 만든다. 이후 두 단계 계층적 클러스터링으로 이러한 흔적을 시간‑진화하는 서사 스레드로 조직하고, 구조화된 메모리 카드 형태의 서사 메모리 스키마를 제공한다. 에이전시 검색 메커니즘을 통해 필요한 서사를 빠르게 찾아내어 다중 홉·시간 추론 성능을 크게 향상시킨다. LoCoMo 벤치마크에서 최첨단 결과를 달성하였다.
상세 분석
TraceMem은 인간의 기억 통합 과정을 모델링한 3단계 파이프라인을 제시한다. 첫 번째 단계인 Short‑Term Memory Processing에서는 XML 기반 프롬프트를 활용한 deductive episodic segmentation을 수행한다. 각 발화 Dn을 앞·뒤 문맥 Dpre, Dsub와 비교해 토픽 전환(TC) 혹은 토픽 전개(TD) 여부를 판단하는 함수 F를 정의하고, 연속적인 TC가 감지될 때마다 새로운 에피소드를 시작한다. 이렇게 구획된 에피소드는 연속적인 의미 벡터와 함께 구조화된 XML 형태로 저장된다.
두 번째 단계인 Synaptic Memory Consolidation은 에피소드별 요약을 생성하고, 이를 사용자‑특화 경험(trace)로 정제한다. 요약은 LLM 기반의 abstractive summarization을 이용해 핵심 사건·인물·시간 정보를 추출하고, 추출된 의미 토큰을 사용자 프로필과 매핑해 개인화된 trace를 만든다. 이 과정은 인간의 시냅스 강화와 유사하게 최근 정보를 빠르게 고정시키며, 에피소드 간 중복 정보를 제거하기 위해 distillation aggregation을 적용한다.
세 번째 단계인 Systems Memory Consolidation에서는 두 단계 계층적 클러스터링을 수행한다. 첫 번째 클러스터링은 토픽 레벨에서 trace들을 군집화해 상위 주제(topic‑level clusters)를 만든다; 두 번째 클러스터링은 시간 축을 고려해 동일 주제 내에서 시간‑진화하는 서사 스레드(thread‑level clusters)를 형성한다. 각 스레드는 메모리 카드(card) 형태로 구조화되며, 카드에는 카드 ID, 주제, 시간 범위, 핵심 요약, 관련 trace ID 리스트가 포함된다. 이러한 카드 기반 스키마는 사용자의 장기 서사를 지속적으로 업데이트하면서도 검색 효율성을 유지한다.
메모리 활용 측면에서 TraceMem은 agentic search를 도입한다. 질의가 들어오면 먼저 관련 서사 스레드를 탐색하고, 해당 스레드에 포함된 에피소드와 trace를 동시 재구성한다. 이를 통해 “어디서 언제 어떤 사건을 겪었는가”와 같은 source‑attribution 정보를 제공함으로써 다중 홉 추론과 시간적 연쇄 추론을 크게 강화한다.
실험에서는 LoCoMo 벤치마크(다중 홉·시간 질문)와 다양한 LLM 백본(OPT, LLaMA, GPT‑3.5) 위에서 성능을 평가하였다. TraceMem은 기존 RAG 기반 메모리, MemOS, A‑Mem, Nemori 등에 비해 평균 7.3%p 이상의 정확도 상승을 보였으며, 특히 시간 순서가 중요한 질문에서 12%p 이상의 개선을 기록했다. Ablation study를 통해 각 단계(에피소드 분할, synaptic consolidation, hierarchical clustering, agentic search)의 기여도를 확인했으며, 특히 두 단계 클러스터링이 서사 일관성 유지에 핵심적인 역할을 함을 입증했다.
전반적으로 TraceMem은 대화형 AI가 인간과 유사한 서사 기억을 형성·재활용하도록 설계된 최초의 통합 프레임워크라 할 수 있다. 메모리의 구조화·동적 재조직, 그리고 에이전시 검색을 결합함으로써 장기 대화 지속성, 개인화된 페르소나 유지, 그리고 복합 추론 능력을 동시에 달성한다.
댓글 및 학술 토론
Loading comments...
의견 남기기