LUCID: 데이터로 배우는 블랙박스 AI 시스템의 확률적 안전성 검증
초록
LUCID는 블랙박스 AI와 확률적 동역학을 갖춘 복잡 시스템(예: 자율주행차)의 안전성을 유한한 데이터만으로 정량적 보장을 제공하며 검증하는 최초의 도구입니다. 핵심은 데이터에서 직접 ‘제어 장벽 인증서’를 학습하고, 커널 기반 추정과 푸리에 변환을 활용해 계산 난제를 효율적인 선형 프로그램으로 변환하는 혁신적인 방법론에 있습니다.
상세 분석
LUCID의 기술적 핵심은 기존 형식 검증 도구의 한계를 뛰어넘는 세 가지 혁신적 접근법에 있습니다.
첫째, 조건부 평균 임베딩(CME)을 통한 데이터 기반 동역학 추정입니다. 시스템의 상태 전이 데이터를 재생 커널 힐베르트 공간(RKHS)에 매핑하여, 시스템의 기대 행동을 블랙박스 상태에서도 추정합니다. 이 추정치 주변에 ‘RKHS 모호성 집합’을 구축함으로써 분포 외 데이터에 대한 강건성을 확보합니다. 이는 모델이 명시적으로 주어지지 않은 시스템에 대한 분포적 강건성 보장의 기초를 마련합니다.
둘째, 유한 푸리에 커널 확장을 통한 계산 문제의 극복이 가장 큰 기여점입니다. 안전성 증명을 위한 제어 장벽 인증서 탐색 문제는 본질적으로 반무한 비볼록 최적화 문제로, 풀이가 매우 어렵습니다. LUCID는 가우시안 커널의 푸리에 확장 특성을 이용해, 탐색 대상 함수(장벽 함수)를 유한 개의 푸리에 기저 함수 선형 결합으로 제한합니다. 이를 통해 문제를 **장벽 계수에 대한 선형 프로그램(LP)**으로 재구성할 수 있게 되었습니다. 이 ‘스펙트럼 장벽’ 접근법은 고속 푸리에 변환(FFT)을 활용한 효율적 계산을 가능하게 합니다.
셋째, 유한 격자 샘플링을 통한 반무한 제약 조건의 이완입니다. 장벽 조건은 상태 공간의 모든 점에서 성립해야 하는 반무한 제약입니다. LUCID는 상태 공간, 초기 집합, 위험 집합 위에 유한한 격자 점들을 생성하고, 삼각 함수에 대한 수학적 경계 결과를 활용해 이 격자 점들에서만 조건이 성립하도록 보장하면 전체 공간에서도 성립함을 증명합니다. 이는 계산 가능한 유한 제약 최적화 문제로의 최종 변환을 완성합니다.
이 방법론의 강점은 명시적 시스템 모델이나 제한적인 동역학 구조(예: 다항식)를 요구하지 않는다는 점이며, 순수하게 데이터에서 학습하고 정량적 안전 하한을 제공한다는 점입니다. 그러나 성능은 데이터의 양과 질, 커널 하이퍼파라미터, 푸리에 기저 개수(M), 격자 해상도 등에 의존합니다. 또한, 안전성 하한 보장은 보수적일 수 있으며, 고차원 시스템으로의 확장 시 계산 복잡도 관리가 지속적인 과제가 될 것입니다.
댓글 및 학술 토론
Loading comments...
의견 남기기