구조 귀납을 위한 추상 초구조 정규형
초록
이 논문은 귀납적 이론 구성에 필요한 구조적 연산을 최소화하고, ‘추상’과 ‘초구조’라는 두 기본 연산에 그 역연산인 ‘역추상’·‘역초구조’를 추가하면 튜링 등가 생성 문법의 전능성을 확보할 수 있음을 증명한다. 이를 바탕으로 일반 문법을 제한된 규칙 형태로 변환하는 정규형(ASNF)을 제시하고, 숨은 변수와 실증주의, 흄의 연관 원칙에 대한 철학적 함의를 논의한다.
상세 분석
논문은 먼저 귀납 과정에서 이론이 갖는 두 축, 즉 구조적(정성적) 측면과 수치적(정량적) 측면을 구분한다. 구조적 측면을 형식화하기 위해 생성 문법을 채택하고, 관측값을 터미널, 내부 변수(숨은 변수)를 논터미널로 대응시킨다. 이때 이론을 구성하는 규칙은 ‘l → r’ 형태의 재작성 규칙이며, 무한히 다양한 형태가 존재한다는 점에서 탐색 공간이 비현실적으로 넓다. 저자는 이러한 무한성을 제한하기 위해 ‘추상(Abstraction)’과 ‘초구조(Super‑structuring)’라는 두 기본 연산을 정의한다. 추상은 유사한 개체들을 하나의 논터미널로 묶는 ‘A → B’ 형태의 리네이밍이며, 초구조는 공간·시간적으로 인접한 개체들을 결합해 새로운 복합 구조를 만드는 ‘A → B C’ 형태의 규칙이다.
하지만 이 두 연산만으로는 튜링 완전성을 달성할 수 없으며, 역연산인 ‘역추상(Reverse Abstraction)’과 ‘역초구조(Reverse Super‑structuring)’가 필요함을 보인다. 역초구조는 ‘AB → C’ 형태로, 두 개의 논터미널을 하나의 새로운 논터미널로 압축한다. 이 네 가지 연산만을 사용하면 일반 문법(General Grammar)이나 문맥 자유 문법(CFG)도 모두 제한된 규칙 집합으로 변환할 수 있다. 구체적으로는 다음과 같은 정규형을 제시한다.
- Weak‑CF‑ASNF: CFG는 ‘A → B’, ‘A → B C’, ‘A → a’ 세 종류만으로 변환 가능. 여기서 ‘A → B’는 리네이밍(REN), ‘A → B C’는 초구조(SS), ‘A → a’는 터미널 매핑(TERMINAL)이다.
- Weak‑GEN‑ASNF: 일반 문법은 위 세 종류에 더해 ‘AB → C’(역초구조, RSS)를 허용한다.
- Strong‑CF‑ASNF: 모든 비리네이밍 규칙에 강한 유일성(strong‑uniqueness)을 부여해, 같은 좌변·우변을 갖는 규칙이 하나뿐임을 보장한다.
강한 유일성은 문법 변환 과정에서 중복 규칙을 제거하고, 탐색 알고리즘이 선택할 후보를 명확히 하는 데 기여한다. 또한, 이 정규형은 ‘숨은 변수’를 도입할 때 그 변수의 존재가 실제 관측 데이터와 직접 연결될 필요가 없다는 점을 형식적으로 설명한다. 즉, 숨은 변수는 설명의 압축성을 높이는 ‘추상’ 역할을 수행하지만, 역추상·역초구조를 통해 언제든지 명시적 관측으로 복원될 수 있다.
철학적 논의에서는 이러한 형식적 결과를 급진적 실증주의와 비교한다. 실증주의는 관측 가능한 양만을 허용하지만, 저자는 ‘역추상’과 ‘역초구조’를 통해 숨은 변수를 정당화하고, 이는 칸트·흄이 제시한 ‘연관 원칙’(principles of connexion)과도 일맥상통한다. 흄이 주장한 ‘인과관계는 관찰된 연속성에 기반한다’는 입장을, 문법 규칙의 연쇄적 재작성으로 재해석한다면, 인과관계 자체가 ‘초구조’와 ‘역초구조’의 조합으로 모델링될 수 있음을 시사한다.
결과적으로 논문은 귀납적 이론 구축을 위한 최소 연산 집합을 제시함으로써, 이론 탐색을 동적 프로그래밍 혹은 A*와 같은 휴리스틱 탐색으로 전환할 수 있는 이론적 기반을 마련한다. 이는 기존의 ‘열거 후 선택’ 방식보다 효율적이며, 구조적 투명성을 제공한다는 점에서 인공지능·기계학습 분야에 실질적인 영향을 미칠 수 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기