자율 AI를 위한 암호 기반 실시간 거버넌스 Aegis 아키텍처와 정책 시행 검증

Aegis는 자율 AI 시스템에 정책과 법적 제약을 실행 조건으로 묶는 암호화된 런타임 거버넌스 프레임워크이다. 시스템 시작 시 불변 윤리 정책 레이어(IEPL)를 서명·해시로 봉인하고, 윤리 검증 에이전트(EVA), 실행 커널 모듈(EKM), 불변 로깅 커널(ILK)으로 실시간 검증·차단·감사를 수행한다. 정책 수정은 쿼럼 서명 후 재시드가 필요하며, 위반 시 자동 셧다운과 증거 자료가 생성된다. Civitas 런타임에서 검증 지연 238 m…

저자: Adam Massimo Mazzocchetti

자율 AI를 위한 암호 기반 실시간 거버넌스 Aegis 아키텍처와 정책 시행 검증
본 논문은 자율 AI 시스템이 인간의 실시간 감시를 초월하는 상황에서 정책·법적 제약을 실행 단계에서 강제할 수 있는 암호 기반 런타임 거버넌스 프레임워크인 Aegis를 제안한다. Aegis는 시스템이 처음 생성될 때 Immutable Ethics Policy Layer(IEPL)를 하드웨어 식별자, 정책 텍스트, 발행자 공개키와 결합한 Genesis Lock으로 암호화·봉인한다. 이후 모든 행동은 Ethics Verification Agent(EVA)와 Enforcement Kernel Module(EKM) 사이의 단일 출판 게이트를 통과해야 하며, EVA는 zk‑STARK 기반 제로 지식 증명을 이용해 행동이 IEPL에 정의된 윤리 규칙을 만족하는지 실시간으로 검증한다. 검증이 성공하고 위험 한계(불확실성) 이하일 경우에만 ILK(Immutable Logging Kernel)에 해시‑연결 로그를 남기고 행동을 커밋한다. 검증 실패 시 EKM은 즉시 시스템을 락다운하고, 서명된 셧다운 인증서를 발행해 증거를 보존한다. 정책 수정은 5명의 검증자(Auctor) 중 최소 3명의 쿼럼 서명을 요구하며, 재시드 과정에서 Genesis Lock을 재생성한다. 내부적으로는 Senatus 모듈이라는 5개의 자율 검증 에이전트가 윤리 가중치 조정과 같은 내부 업데이트도 동일한 쿼럼 절차를 통해 승인받게 함으로써, 내부 드리프트를 방지한다. 구현은 Rust, Solidity, Python·Go 등 다중 언어 스택을 활용했으며, zk‑STARK 기반 증명과 불변 로그 체인을 결합해 내변조성을 확보한다. 실험은 Civitas 런타임에서 수행됐으며, 검증 지연 평균 238 ms, 발행 오버헤드 평균 9.4 ms, 비거버넌스 대비 정렬 유지율이 향상된 결과를 보였다. 위협 모델은 악성 코드 삽입, 정책 변조, 사이드채널 공격 등을 포함하고, Aegis는 이러한 위협에 대해 즉시 실행 차단·증거 보존으로 대응한다. 논문은 정책 자체의 정확성 검증 부재, 고성능 실시간 요구사항에 대한 확장성 한계, 외부 법·규제와의 연계 문제 등을 제한점으로 제시한다. 최종적으로 Aegis는 정책 위반 행동을 실행 불가능하게 만들고, 검증·감사 가능한 증거를 제공함으로써 고신뢰 자율 AI 배포에 필요한 새로운 거버넌스 패러다임을 제시한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기