Δ1과 LLM을 결합한 신뢰성·설명가능한 신경‑심볼릭 추론 프레임워크
초록
본 논문은 완전 삼각 표준 모순(FTSC) 기반 자동 정리 생성기 Δ1을 대규모 언어 모델(LLM)과 결합해, 최소 불만족 절(clause) 집합을 다항 시간 내에 결정적으로 생성하고, 그 증명 과정을 자연어로 설명함으로써 “구성 단계부터 설명 가능”한 신경‑심볼릭 추론 파이프라인을 제시한다. 의료·규제·컴플라이언스 등 고위험 분야 실험을 통해 논리적 정확성·최소성·인간 친화적 해석이 동시에 달성됨을 입증한다.
상세 분석
Δ1은 “Full Triangular Standard Contradiction”(FTSC)이라는 구조적 모순을 이용해, 입력된 n개의 원자 술어를 순열마다 하나의 완전한 불만족 절 집합으로 변환한다. 각 절 D₁…Dₙ₊₁은
D₁ = x₁,
D₂ = x₂ ∨ ¬x₁, …,
Dₙ = xₙ ∨ ¬x₁ ∨ … ∨ ¬xₙ₋₁,
Dₙ₊₁ = ¬x₁ ∨ … ∨ ¬xₙ
의 형태를 갖으며, 이는 정의에 의해 반드시 불만족이다. Δ1은 “S {C} ⊢ ¬C” 형태의 정리를 모든 절 C에 대해 자동으로 생성한다. 이 과정은 검색이나 SAT/SMT 호출 없이 순수히 구성적이며, 복잡도는 개별 FTSC당 O(n³), 전체 순열에 대해 O(n·n!) 수준이다. 따라서 논리적 완전성(모든 가능한 최소 모순을 포괄)과 비중복성(각 정리는 서로 동형이 아님)이 보장된다.
LLM 레이어는 두 가지 역할을 수행한다. 첫째, 입력 텍스트를 TPTP‑style 술어 집합으로 변환하는 프론트‑엔드 역할이다. 둘째, Δ1이 출력한 증명 트레이스를 자연어 설명, 원인‑결과 해석, 그리고 도메인별 조치 권고로 변환한다. 이때 LLM은 설명의 “salience”(중요도)를 평가해 인간 사용자가 직관적으로 이해하기 쉬운 순서로 정렬한다.
실험에서는 의료 진단 규칙, 금융 규제 정책, 계약 조항 등 세 분야에 걸쳐 1,200여 건의 사례를 구축하였다. 정량적 지표로는 (1) Δ1이 생성한 MUS가 기존 MUS 추출기(MARCO, ReMUS 등)와 동일하거나 더 작은 크기를 보였으며, (2) LLM이 제공한 설명이 전문가 평가에서 평균 4.6/5점(5점 만점) 이상의 신뢰성을 얻었다. 또한, Δ1+LLM 파이프라인은 전체 처리 시간을 기존 SAT‑기반 워크플로 대비 30% 이상 단축했다.
비판적으로 보면, Δ1은 입력 제약(비보완성, 술어 중복 금지)을 강하게 요구한다. 실제 도메인 데이터는 종종 중복·상충 술어를 포함하므로, 전처리 단계에서 정제 비용이 발생한다. 또한, 현재 구현은 1차 논리(프로포지션)와 제한된 1차 논리(단순 함수)만 지원하므로, 복합적인 양화·함수 심볼을 포함한 대규모 온톨로지에는 확장이 필요하다. LLM 설명의 품질은 모델 크기와 프롬프트 설계에 크게 좌우되며, “설명 가능성”을 보장하려면 LLM 출력에 대한 형식 검증 메커니즘이 추가로 요구된다.
종합하면, Δ1은 논리적 완전성·최소성·재현성을 수학적으로 보장하는 최초의 자동 정리 생성기이며, LLM과의 결합을 통해 인간이 이해 가능한 설명을 자동으로 제공한다는 점에서 신경‑심볼릭 AI의 새로운 패러다임을 제시한다. 다만, 입력 전처리와 고차 논리 확장, LLM 출력 검증이라는 실용적 과제가 남아 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기