플라이스펙 자동 증명과 학습 보조 시스템

초록

플라이스펙 프로젝트의 수학 지식을 ATP와 머신러닝 기반 전제 선택기에 연결해, 이전 정리만 사용해 자동으로 정리를 증명하는 시스템을 구축하였다. 14CPU 워크스테이션에서 30초 이내에 14185개 정리 중 39%를 자동 증명했으며, 구현·번역·학습·통합 네 단계의 기술적 과정을 상세히 제시한다.

상세 분석

이 논문은 HOL Light 기반의 고차 논리 체계인 플라이스펙(Flyspeck) 전체를 자동화된 증명 파이프라인에 연결하는 방법을 제시한다. 첫 번째 핵심은 HOL Light 논리를 세 가지 ATP 형식—무타입 1차, 다형성 타입 1차, 고차 타입—으로 sound하게 변환하는 번역기 구현이다. 변환 과정에서 변수 스코프와 타입 정보를 보존하면서도 ATP가 효율적으로 처리할 수 있도록 전처리 규칙을 설계하였다. 두 번째 단계는 HOL Light 내부에서 각 정리의 의존 관계와 사용된 전제들을 추출해 데이터베이스화하는 작업이다. 이를 통해 머신러닝 모델이 학습에 필요한 피처를 얻을 수 있었다. 세 번째는 전제 선택을 위한 학습 알고리즘 선택이다. 논문에서는 k-최근접 이웃, 라쏘 회귀, 신경망 기반 모델을 비교하고, 특히 라쏘 회귀가 희소한 전제 집합에서 높은 정밀도를 보임을 확인했다. 학습된 모델은 현재 증명하려는 목표 정리와 가장 관련성이 높은 전제들을 상위 N개로 추천한다. 마지막으로 이 추천 전제를 ATP에 전달하고, ATP가 제한된 시간(30초) 내에 증명을 시도하도록 하는 통합 어드바이저를 HOL Light에 삽입하였다. 실험에서는 ‘부트스트래핑 시나리오’를 채택해, 초기 공리만으로 시작해 증명된 정리를 순차적으로 추가하면서 전체 14185개 정리를 자동으로 증명했다. 결과는 39%의 정리를 30초 이내에 성공적으로 증명했으며, 특히 대수적 구조와 기하학적 성질을 다루는 정리에서 높은 성공률을 보였다. 실패한 정리들은 전제 선택 정확도 부족, ATP의 검색 공간 폭발, 혹은 고차 논리 특성(예: 무한히 중첩된 함수) 때문에 발생한 것으로 분석된다. 전체 시스템은 완전 자동화된 ‘푸시버튼’ 모드에서도 실용적인 성능을 보여, 형식화된 수학 지식의 자동 활용 가능성을 크게 확장한다.