자연어 기반 인지 규칙 자동 형식화 NL2CA
📝 원문 정보
- Title:
- ArXiv ID: 2512.18189
- 발행일:
- 저자: Unknown
📝 초록 (Abstract)
인지 컴퓨팅 모델은 인간의 심사숙고와 의사결정을 형식적이며 해석 가능한 방식으로 기술할 수 있지만, 모델 구축에는 여전히 많은 인력이 소요된다. 본 논문에서는 인간 경험에 대한 자연어 서술을 자동으로 인지 의사결정 규칙으로 형식화하는 새로운 방법인 NL2CA를 제안한다. 기존 연구가 수동 혹은 인간‑주도 인터랙티브 방식에 의존하는 것과 달리, 본 방법은 전 과정이 완전 자동화되어 인간 개입이 전혀 필요하지 않다. 먼저, 미세조정된 대형 언어 모델(LLM)을 이용해 텍스트를 선형 시계열 논리(LTL)로 변환하고, 이후 비지도 비평 트리(Critic Tree)를 통해 논리를 정제한다. 최종적으로 도출된 논리는 상징적 인지 프레임워크와 호환되는 실행 가능한 생산 규칙으로 변환된다. 도출된 규칙을 기반으로 인지 에이전트를 구축하고, 실제 행동 데이터를 활용한 인지 강화 학습으로 최적화한다. 본 방법은 (1) NL‑to‑LTL 번역 분야에서 인간 전문가와 대규모 벤치마크 모두에서 인간‑인‑루프 피드백 없이 일관된 성능을 보이는 CriticNL2LTL 모듈을 통해 검증되었으며, (2) 인지 운전 시뮬레이션에서 인터뷰 기반 자동 구축 에이전트가 70여 개의 다양한 위기 상황에 대한 의사결정 패턴을 성공적으로 학습하였다. 실험 결과는 NL2CA가 비구조화된 텍스트 데이터로부터 확장 가능하고 해석 가능하며 인간 정렬된 인지 모델을 자동으로 설계할 수 있음을 보여준다.💡 논문 핵심 해설 (Deep Analysis)
이 논문은 인지 과학과 인공지능을 연결하는 중요한 교량 역할을 한다는 점에서 학술적·실용적 가치를 동시에 지닌다. 기존 인지 모델링은 전문가가 직접 규칙을 정의하거나, 인간‑컴퓨터 인터랙션을 통해 점진적으로 모델을 개선하는 방식에 의존해 왔다. 이러한 접근은 시간·노력·전문성 비용이 크게 들며, 대규모 데이터에 적용하기 어렵다는 한계를 안고 있다. NL2CA는 이러한 문제점을 근본적으로 해결한다는 점에서 혁신적이다.첫 번째 핵심은 ‘텍스트 → LTL’ 변환 단계이다. 저자들은 사전 학습된 대형 언어 모델을 도메인‑특화 데이터셋으로 미세조정함으로써, 자연어 서술을 정확히 선형 시계열 논리 형태로 매핑한다. LTL은 시간적 순서와 조건부 관계를 명시적으로 표현할 수 있어, 인간의 의사결정 흐름을 형식화하기에 적합한 논리 체계이다. 여기서 중요한 점은 인간 피드백 없이도 모델이 높은 정확도를 유지한다는 점이다. 이는 대규모 비지도 학습이 가능한 현재 LLM 기술의 잠재력을 잘 보여준다.
두 번째 단계인 ‘Critic Tree’를 통한 정제는 비지도 학습 기반의 자체 검증 메커니즘이다. 비평 트리는 생성된 LTL 식을 구조적으로 분석하고, 논리적 모순이나 불필요한 복잡성을 자동으로 제거한다. 기존 연구에서는 이러한 정제 과정을 위해 별도의 규칙 기반 엔진이나 인간 검토가 필요했지만, 여기서는 트리 구조가 자체적으로 ‘비평자’ 역할을 수행한다는 점이 눈에 띈다.
세 번째 단계는 정제된 LTL을 상징적 인지 프레임워크와 호환되는 생산 규칙으로 변환하는 과정이다. 이 규칙들은 전통적인 인지 아키텍처(예: ACT‑R, SOAR)에서 바로 실행 가능하도록 설계되었으며, 따라서 기존 인지 모델링 파이프라인에 손쉽게 통합될 수 있다.
마지막으로, 도출된 규칙을 기반으로 구축된 에이전트를 실제 행동 데이터에 맞춰 강화 학습으로 최적화한다는 점은 ‘하이브리드’ 접근의 좋은 사례다. 규칙 기반의 해석 가능성을 유지하면서, 강화 학습을 통해 환경 적응성을 확보한다. 실험에서는 운전 시뮬레이션이라는 복합적인 도메인에서 70여 개의 시나리오를 학습했으며, 이는 인간 인터뷰 데이터를 자동으로 모델링하고, 실제 의사결정 패턴을 재현하는 데 성공했음을 의미한다.
전체적으로 볼 때, NL2CA는 (1) 완전 자동화, (2) LLM‑기반 자연어‑논리 변환, (3) 비지도 정제, (4) 상징적 규칙 생성, (5) 강화 학습 기반 최적화라는 다섯 축을 결합함으로써 인지 모델링의 생산성을 획기적으로 높인다. 다만 현재는 LTL에 한정된 표현력과, 복잡한 인간 감정·동기와 같은 비논리적 요소를 포괄하기 어려운 점이 남아 있다. 향후 연구에서는 보다 풍부한 시맨틱 프레임워크(예: CTL, μ‑calculus)와 멀티모달 입력(음성·영상) 통합을 통해 모델의 범용성을 확대할 필요가 있다.