재귀적 데이터 압축과 기반 추론을 통한 인공 일반 지능
초록
프란츠는 일반 인공지능(AGI) 구현을 위해 “일반 데이터 압축 알고리즘”을 핵심 목표로 제시한다. 압축 능력이 충분히 발달하면 감각 데이터를 압축·예측하는 과정이 개념 형성과 상식 추론을 가능하게 하며, 이를 위해 가설 기반의 유연한 인덕티브 바이어스와 재귀적 특성, 정교한 특징(피처) 추출이 필요하다고 주장한다. 또한 부분적인 AGI 진전을 측정할 수 있는 압축률 기반 지표를 제안한다.
상세 분석
이 논문은 AGI 연구의 방향성을 ‘일반 데이터 압축’이라는 단일 문제로 환원한다는 점에서 독창적이다. 저자는 압축이 곧 세계 모델링이며, 압축률이 높을수록 더 짧은 프로그램(가설)으로 데이터를 설명할 수 있다고 가정한다. 이를 위해 다음과 같은 핵심 메커니즘을 제시한다.
-
유연한 인덕티브 바이어스: 알고리즘은 사전 정의된 고정 모델이 아니라 입력 데이터에 따라 동적으로 가설 공간을 확장한다. 이는 인간 두뇌가 새로운 환경에 적응하면서 새로운 개념을 형성하는 방식과 유사하다.
-
정규성·정교성·완전성: 가설은 가능한 한 단순하고 서로 직교(orthogonal)해야 하며, 데이터 전체를 설명할 수 있는 완전한 집합을 목표로 한다. 직교성은 중복을 최소화하고, 새로운 가설이 기존 가설과 충돌하지 않도록 보장한다.
-
재귀적 압축: 초기 압축 단계에서 얻은 가설을 새로운 ‘데이터’로 취급해 다시 압축한다. 이렇게 하면 고차원 구조를 점진적으로 단순화할 수 있으며, 복잡한 세계 모델을 계층적으로 구축한다.
-
압축률 기반 진전 측정: 부분적인 AGI 성취를 정량화하기 위해, 제한된 복잡도 L 이하의 모든 프로그램을 열거하고, 각 프로그램이 생성하는 문자열을 최적 압축 프로그램(p*)과 비교한다. 평균 압축률 R(L)은 알고리즘이 해당 복잡도 수준에서 얼마나 완전하게 압축했는지를 나타낸다.
-
기반(grounding)과 자원 활용: 압축된 가설은 ‘정신 무대’에서 시뮬레이션될 수 있으며, 이는 전통적인 명제 논리보다 풍부한 의미론적 연결을 제공한다. 가설이 실제 감각 데이터와 연결될 때, 보편적 양화문(∀)과 같은 추론이 가능해진다.
-
한계와 실현 가능성: 저자는 대부분의 문자열이 압축 불가능하다는 코울로고프 복잡도 이론을 인정하면서, 실제 세계에서 의미 있는 데이터는 압축 가능한 소수에 불과하므로, 이 부분에 집중하면 충분하다고 주장한다. 또한, 인간 DNA 크기와 비교해 ‘일반 지능 알고리즘’은 비교적 작은 메모리 공간에 구현될 수 있다는 가설을 제시한다.
전체적으로 논문은 압축을 ‘인식·학습·추론’의 통합 메커니즘으로 보고, 이를 구현하기 위한 알고리즘적 특성(유연성, 직교성, 재귀성)을 구체화한다. 그러나 실제 구현 방안, 가설 탐색의 효율적 탐색 전략, 그리고 압축과 강화학습을 결합한 구체적 아키텍처에 대한 상세 설계는 부족하다.
댓글 및 학술 토론
Loading comments...
의견 남기기