텍스트와 논리 통합을 위한 뉴로심볼릭 언어 Logitext
초록
Logitext는 자연어 문서를 부분적으로 논리화된 텍스트 제약(NLTC)으로 변환하고, LLM 기반 텍스트 평가와 SMT 솔버를 결합해 텍스트와 논리 추론을 교차적으로 수행한다. 새로운 콘텐츠 모더레이션 벤치마크와 LegalBench, Super‑Natural Instructions 실험에서 정확도와 커버리지를 모두 향상시켰으며, 완전 형식화가 어려운 실제 문서에 대한 뉴로심볼릭 접근을 최초로 제시한다.
상세 분석
이 논문은 자연어 이해에서 텍스트와 논리 추론이 교차적으로 필요함을 명확히 진단하고, 기존 뉴로심볼릭 시스템이 “전부 형식화 가능”이라는 전제에 머물러 실제 문서의 복합 구조를 다루지 못한다는 한계를 지적한다. 이를 해결하기 위해 제안된 Logitext는 두 가지 핵심 요소로 구성된다. 첫째, 자연어 텍스트 제약(NLTC)이라는 새로운 형식을 도입해, “혐오”, “즉각적 위협”처럼 인간 판단에 의존하는 개념을 텍스트 블록으로 그대로 보존하면서도 논리 변수와 연결한다. 둘째, 이러한 NLTC를 SMT 이론의 하나로 취급해 기존 SMT 솔버와 원활히 연동한다. 구체적으로 Logitext 프로그램은 변수 선언, 텍스트 let‑바인딩, 논리 제약 블록, 그리고 for‑some/forall 같은 편의 구문으로 구성된다. 체크(check) 함수는 부분 할당을 입력받아 논리 솔버가 제안하는 불리언 할당을 기반으로, 각 텍스트 변수에 대해 LLM‑기반 NLSolver가 실제 텍스트 평가를 수행한다. NLSolver는 LLMPropose‑와 LLMVerify‑를 반복해 텍스트 제약을 만족시키는 문자열을 탐색하고, 만족하지 못하면 SMT 솔버에게 되돌려줘 다른 논리 할당을 시도하도록 만든다. 이 반복 구조는 “외부 논리 루프 ↔ 내부 텍스트 루프”라는 두 단계 협업을 구현한다. 실험에서는 5개의 정책(6~21개 조항)으로 구성된 콘텐츠 모더레이션 데이터셋을 새로 구축하고, 기존 LLM 단일 프롬프트 방식이 보이는 ‘구성적 격차(Δ)’와 ‘조합적 격차(Δ′)’를 정량화한다. 결과는 Logitext가 특히 조합적 격차를 크게 줄이며, Z3와 같은 전통 SMT 솔버가 열거할 수 있는 모든 만족 할당을 거의 완전하게 복원함을 보여준다. 또한 LegalBench과 Super‑Natural Instructions에서도 정확도와 커버리지가 전반적으로 상승한다. 논문은 LLM 기반 추론을 SMT 이론으로 공식화함으로써, 완전 형식화가 불가능한 자연어 문서에서도 논리적 일관성을 유지하면서 텍스트 의미를 정밀히 평가할 수 있는 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기