긴맥락 인공지능을 위한 인지 상태 평면
초록
StatePlane은 모델에 독립적인 인지 상태 관리 계층을 제안한다. 에피소딕·시맨틱·프로시저럴 상태를 이벤트 경계 탐지와 정보‑이론적 선택적 인코딩을 통해 저장하고, 목표‑조건부 검색·재구성을 통해 제한된 KV‑캐시 안에서 필요한 컨텍스트만 재구성한다. 보안·거버넌스 레이어와 기업용 배포 설계가 포함돼, 장기 대화·멀티세션 작업에서 일관성·정책 준수·프롬프트 주입 방어를 제공한다.
상세 분석
StatePlane 논문은 현재 LLM·SLM이 직면한 “컨텍스트 창 제한” 문제를 메모리 용량이 아닌 “상태 관리” 문제로 재정의한다. 인간의 작업 기억·장기 기억 모델을 차용해, 에피소딕(시간·목표·결과), 시맨틱(추상화·스키마), 프로시저럴(스킬·워크플로) 세 가지 상태 유형을 명시적으로 구분한다. 핵심 메커니즘은 (1) 이벤트 경계 탐지기로, KL‑다이버전스 기반의 확률 변화가 θ를 초과하면 새로운 에피소드를 시작한다. (2) 선택적 인코딩 단계에서는 유틸리티·놀라움·새로움 함수를 결합한 salience s(e)를 계산하고, 정보 병목 원칙 min I(S;H) − β·I(S;Y) 을 최적화해 제한된 토큰 예산 안에서 미래 의사결정에 가장 유용한 정보를 압축한다. (3) KV‑aware 재구성 알고리즘은 |C_t| ≤ L_max을 강제하면서, 목표‑조건부 검색(Retrieve)와 정책 필터링(π)을 통해 필요한 증거와 제약만을 추출한다. 재구성된 컨텍스트는 “증거‑지향(evidence‑oriented)”이며, 모델에게는 명령이 아닌 사실만 제공한다는 점이 프롬프트 주입 방어에 핵심적이다.
보안·거버넌스 설계는 네 가지 위협(기밀성, 무결성, 가용성, 격리)에 대응한다. 쓰기 경로에서는 증거 요구, 인간‑인‑루프 승인, PII 자동 마스킹 등을 통해 상태 오염을 차단하고, 읽기 경로에서는 타입‑제한된 구조체와 정책 기반 필터링으로 명령 주입을 방지한다. 또한 다계층 접근 제어(tenant/user/role/namespace)와 상세 감사 로그를 제공해 기업 환경에서 규제 준수를 가능하게 한다.
평가 프레임워크는 정책 바인딩(LH‑PCT), 예외 원장(ELR), 이유 안정성(RCDS), 툴‑중심 케이스(TH‑CBC), 프라이버시 집행(PRSE), 메모리 중독(MP‑RI) 등 6가지 도메인 벤치마크를 정의하고, 정답률, 근거 완전성, 정책 위반률, 토큰당 정확도 등 다차원 메트릭을 제시한다. 실험 결과, StatePlane은 동일 토큰 예산 하에서 기존 슬라이딩 윈도우·요약·RAG 기반 방법보다 약 30‑45% 높은 커밋 준수율과 2‑3배 낮은 모순률을 기록한다.
시스템 아키텍처는 두‑콜 계약(PrepareContext, CommitOutcome)으로 모델과 완전히 분리되며, 온‑프레미스와 Azure 클라우드‑네이티브 두 가지 배포 옵션을 제공한다. 이는 모델 불변성을 유지하면서도 상태를 지속적으로 진화시킬 수 있는 MLOps 친화적 접근이다. 한계점으로는 salience 추정 정확도에 크게 의존한다는 점, 쓰기 게이트로 인한 지연, 그리고 외부 에이전트와의 협업 전제 등이 있다. 윤리적 측면에서는 상태 투명성, 사용자‑스코프 삭제 권한, 최소 PII 저장 등을 통해 GDPR 등 규제와 정합성을 확보한다. 전반적으로 StatePlane은 “컨텍스트 창 확장”이 아니라 “인지 상태 평면”을 구축함으로써 장기 지능을 구현하려는 실용적 로드맵을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기