코드멤 동적 MCP와 절차적 메모리를 통한 재현 가능한 에이전트 설계
📝 원문 정보
- Title: CodeMem: Architecting Reproducible Agents via Dynamic MCP and Procedural Memory
- ArXiv ID: 2512.15813
- 발행일: 2025-12-17
- 저자: Nishant Gaurav, Adit Akarsh, Tejas Ravishankar, Manoj Bajaj
📝 초록 (Abstract)
현재 도구 활용 AI 에이전트는 행동 공간의 제한, 컨텍스트 비효율성, 그리고 확률적 불안정성으로 인해 n8n·Zapier와 같은 플랫폼이 제공하는 반복 작업 자동화에 부적합하다. 기존 연구(CodeAct, DynaSaur, Code Mode)는 전체 파이썬을 행동 공간으로 삼아 도구 수를 무한히 확장하고, 코드 블록을 통해 복합 작업을 단일 단계로 수행함으로써 컨텍스트를 간결하게 유지하는 데 성공했지만, 동일 환경·동일 과제에서도 LLM의 확률적 특성 때문에 실행 경로가 달라지는 문제를 해결하지 못했다. 따라서 일관성과 신뢰성을 보장하기 위한 절차적 메모리가 필요하다. 본 논문은 절차적 메모리를 코드 형태로 구현하여 재현 가능한 에이전트 워크플로우를 구축하고, 결정론적 신뢰성을 제공하는 CodeMem 아키텍처를 제안한다.💡 논문 핵심 해설 (Deep Analysis)

두 번째 한계인 “컨텍스트 비효율성”은 LLM이 대규모 프롬프트를 처리하면서 토큰 비용이 급증하고, 불필요한 중간 결과가 컨텍스트에 남아 모델의 집중력을 저하시킨다. 파이썬 코드 블록을 활용해 복합 연산을 한 번에 실행하고, 필요한 출력만을 반환하도록 설계한 점은 토큰 사용을 크게 절감하고, 에이전트가 장기적인 목표에 집중하도록 만든다.
하지만 가장 근본적인 문제는 “확률적 불안정성”이다. 동일한 입력과 환경에서도 LLM은 내부 샘플링 메커니즘에 의해 서로 다른 토큰 시퀀스를 생성한다. 결과적으로 동일 작업에 대해 서로 다른 실행 경로가 발생하고, 재현성이 보장되지 않는다. 이는 특히 기업용 자동화(예: n8n, Zapier)에서 요구되는 “동일 입력 → 동일 결과”를 충족시키지 못한다는 치명적 단점이다.
CodeMem은 이 문제를 “절차적 메모리”라…