에이전트 메모리 기반 텍스트‑투‑SQL 혁신: AgentSM

에이전트 메모리 기반 텍스트‑투‑SQL 혁신: AgentSM
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

AgentSM은 기존 에이전트형 Text‑to‑SQL 시스템이 겪는 중복 탐색·불안정성을 해결하기 위해, 실행 궤적을 구조화된 ‘시맨틱 메모리’로 저장·재활용한다. 두 개의 협업 에이전트와 복합 툴 설계로 탐색 비용을 25 % 감소시키고, Spider 2.0 Lite에서 44.8 %의 최고 정확도를 달성한다.

상세 분석

AgentSM은 “시맨틱 메모리”라는 새로운 개념을 도입해, 에이전트가 수행한 데이터 탐색·SQL 생성·검증 단계 전체를 구조화된 프로그램 형태로 저장한다. 이 메모리는 단순 벡터 검색이 아니라, 단계별 의미 주석과 도구 사용 기록을 포함한 트래젝터리(trajectory)이다. 새로운 질의가 동일 데이터베이스에 들어오면, 플래너 에이전트는 메모리에서 유사한 과거 트래젝터리를 검색해 재사용함으로써 중복 스키마 탐색을 회피하고, 필요한 경우에만 추가 탐색을 수행한다.

두 에이전트 구조는 플래너와 스키마링크 에이전트로 나뉘며, 플래너는 전체 흐름을 설계·SQL을 직접 생성·수정하고, 스키마링크 에이전트는 제한된 단계(보통 5회) 내에서 세부 스키마 정보를 파악한다. 이 설계는 과도한 에이전트 분할에 따른 통신 오버헤드와 메모리 파편화를 방지한다.

툴 측면에서는 일반‑전용 툴과 ‘복합 툴(composite tools)’을 구분한다. 복합 툴은 자주 연속해서 사용되는 단일 툴들을 하나의 인터페이스로 묶어, 플래너가 한 번의 호출로 여러 작업(예: 스키마 검색 + 샘플 데이터 조회)을 수행하게 한다. 또한, SQL 실행 툴에 자동 재정정(self‑refinement) 메커니즘을 탑재해 실행 오류 시 즉시 수정 제안을 생성, 트래젝터리 중단을 최소화한다.

실험 결과, Spider 2.0 벤치마크에서 평균 토큰 사용량과 트래젝터리 길이를 각각 25 %·35 % 줄였으며, Spider 2.0 Lite에서는 44.8 %의 실행 정확도로 현존 최고 성능을 기록했다. Ablation 연구에서는 메모리 재사용이 트래젝터리 길이 감소에 가장 큰 기여를 함을 확인했다.

AgentSM은 텍스트‑투‑SQL 외에도 데이터 정제·변환·추출 등 복합 데이터 작업에 적용 가능하도록 설계돼, 기업 환경에서 대규모 스키마와 다양한 SQL 방언을 다루는 데 필요한 효율성과 안정성을 동시에 제공한다.


댓글 및 학술 토론

Loading comments...

의견 남기기