연결 테이블루 증명에 RNN을 활용한 추론 가이드

본 논문은 Mizar 수학 라이브러리에서 추출한 연결 테이블루 증명 데이터를 이용해 순환 신경망(RNN) 기반의 내부 가이드를 설계한다. RNN은 현재 증명 트리의 분기(리터럴) 경로를 인코딩해 다음에 선택할 절(clause)을 예측하며, 이를 기존의 Gradient‑Boosted Tree 방식과 비교한다. 실험 결과, 리터럴 경로를 입력으로 할 때 길이가 길수록 예측 정확도가 크게 향상되고, 특히 8개의 리터럴을 포함한 경우 85%의 정확도를…

저자: Bartosz Piotrowski, Josef Urban

본 논문은 자동 정리 증명 시스템, 특히 연결 테이블루(connection tableau) 방식에 RNN 기반 내부 가이드를 적용한 최초의 연구 중 하나이다. 연구는 크게 네 부분으로 구성된다. 1. **데이터 구축** - Mizar 수학 라이브러리(MML)를 TPTP 형식으로 변환한 뒤, leanCoP 프로버를 이용해 1,382개의 연결 테이블루 증명을 생성하였다. - 각 증명 트리에서 루트에서 비루트·비리프 노드까지의 경로를 두 종류로 추출한다. 첫 번째는 리터럴 경로 P_lits(r→n)이며, 두 번째는 그 경로를 따라 선택된 절들의 순서 P_cls(r→n)이다. - 모든 변수와 스콜렘 함수를 각각 VAR, SKLM 토큰으로 대체해 일반화하였다. - 각 노드 n에 대해 실제 선택된 절 clause(n)을 레이블로 삼아 (입력 시퀀스, 레이블) 쌍을 만든다. 전체 567,273개의 학습 예시가 확보되었으며, 60 %/10 %/30 % 비율로 학습·검증·시험 집합으로 분할하였다. 2. **모델 설계 및 학습** - Luong 등(2015)의 NMT(seq2seq) 아키텍처를 그대로 사용했으며, 인코더‑디코더 구조에 GRU 기반 RNN을 채택하였다. - 하이퍼파라미터는 기존 심볼릭 작업에 성공한 설정을 그대로 적용했고, 학습은 교차 엔트로피 손실을 최소화하는 방식으로 진행하였다. - 예측은 beam search(빔 폭 k=1 또는 10)로 수행했으며, 모델이 출력한 k‑best 절 시퀀스와 실제 가능한 절 시퀀스가 교집합을 이루면 성공으로 간주한다. 3. **실험 및 결과** - **절 선택 정확도**: 리터럴 경로를 입력으로 할 때 단일 절 예측 정확도 0.64, 10‑best에서는 0.72를 기록했다. 반면 절 경로 입력은 0.17/0.36에 그쳤다. 이는 리터럴 자체가 증명 상태를 더 풍부히 표현한다는 점을 보여준다. - **입력 길이 의존성**: 입력 시퀀스 길이가 증가할수록 정확도가 상승하였다. NMT는 길이 8 에서 0.85의 정확도를 달성했으며, XGBoost는 초기 0.43에서 시작해 길이 7 에서 0.51 이하로 급격히 감소했다. 이는 RNN이 장기 의존성을 효과적으로 학습함을 의미한다. - **다중 절 예측**: 2~3개의 연속 절을 동시에 예측하도록 확장했지만 정확도는 크게 떨어졌다(예: 2절 예측 0.11~0.19). 이는 현재 모델이 한 번에 하나의 선택을 예측하는 데 최적화돼 있음을 시사한다. 4. **Conjecturing 실험** - 절 선택이 아닌 다음 리터럴 자체를 생성하도록 모델을 재학습시켰다. 후보 어휘 수는 6,442개이며, NMT는 길이 7 에서 0.34의 정확도를 보였다. - 생성된 리터럴 중 일부는 정답과 구조가 유사했으나 문법 오류가 있거나 의미가 부정확했다. 예시로 “k2 tarski(SKLM,SKLM)=”와 같은 비정상적인 출력이 있었다. - 이 실험은 RNN이 단순 분류를 넘어 새로운 심볼을 조합해 의미 있는 수식을 만들어낼 잠재력을 보여준다. 5. **비교 분석** - XGBoost 기반 특징 모델은 리터럴 경로를 피처화해 0.43의 정확도를 기록했으며, 짧은 입력에서는 RNN보다 우수했지만 길이가 늘어날수록 성능이 정체되었다. - RNN은 입력 전체를 은닉 상태에 압축해 복잡한 컨텍스트를 반영함으로써, 특히 긴 경로에서 뛰어난 성능을 발휘한다. 6. **결론 및 향후 과제** - 연결 테이블루 증명에서 증명 상태를 순차적 입력으로 처리하는 RNN 기반 접근법이 기존 특징 기반 방법을 능가함을 실증하였다. - 긴 컨텍스트를 활용한 정확도 향상은 실제 ATP(자동 정리 증명) 시스템에 적용될 경우 탐색 공간을 크게 축소할 가능성을 시사한다. - 향후 작업으로는 학습된 모델을 실제 ATP 파이프라인에 통합하고, 증명 성공률을 직접 측정하는 평가를 진행할 계획이다. 또한, 리터럴 생성 능력을 더욱 정교화해 자동 정리 시스템이 새로운 정의나 보조 정리를 스스로 제안하도록 하는 연구도 제안한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기