심리학을 위한 알고리즘 복잡도 코딩 정리법 구현
이 논문은 짧은 문자열(길이 2‑11)의 알고리즘 복잡도(Kolmogorov‑Chaitin 복잡도)를 추정하기 위한 코딩 정리법(Coding Theorem Method)을 소개하고, 이를 R 패키지로 구현한 ACSS(Algorithmic Complexity for Short Strings)를 제시한다. 기존에는 이론적으로 불가능하다고 여겨졌던 짧은 시퀀스의 복잡도 추정이 가능해졌으며, 이 도구는 이진 문자열뿐 아니라 최대 9개의 기호를 사용하는…
저자: Nicolas Gauvrit, Henrik Singmann, Fern
본 연구는 심리학 분야에서 짧은 문자열의 복잡도를 정량화하는 데 필요한 이론적·실용적 기반을 제공한다. 먼저 Kolmogorov‑Chaitin 복잡도 K(s)의 정의와 불가산성, 상한 근사(압축 알고리즘) 한계 등을 설명하고, 특히 문자열 길이가 5‑50 사이인 심리학 실험 데이터에 기존 방법이 적용되기 어려운 이유를 상세히 논의한다. 이어서 Levin이 제시한 코딩 정리(K(s) ≈ –log₂ m(s) + O(1))를 기반으로 알고리즘 확률 m(s)를 추정하는 절차를 소개한다. 저자들은 모든 가능한 프리픽스‑프리 튜링 머신을 무작위로 생성하고, 각 머신이 생산하는 문자열을 기록해 빈도 분포를 만든다. 이 과정은 컴퓨터 클러스터에서 사전 계산된 형태로 저장되며, 문자열 길이 2‑11, 알파벳 크기 2‑9에 대해 완전한 테이블을 제공한다.
이러한 사전 데이터를 활용한 R 패키지 ACSS는 사용자가 문자열을 입력하면 즉시 복잡도(K)와 알고리즘 확률(m)을 반환한다. 기존의 압축 기반 추정과 달리, ACSS는 (1) 다중 알파벳 지원, (2) 실시간 계산 불필요, (3) 길이 11 초과 문자열에 대한 근사 추정 기능을 제공한다. 특히, 복잡도 값을 베이즈 요인에 직접 연결함으로써, 인간이 무작위성을 판단할 때 실제 확률이 아닌 “역확률”을 사용한다는 가설을 정량화한다.
논문은 세 가지 실증적 예시를 통해 ACSS의 적용 가능성을 보여준다. 첫 번째 예시는 인간이 생성한 무작위 수열(예: 1‑6 주사위, 0‑9 숫자)의 복잡도가 실행 기능(억제, 지속적 주의)과 어떻게 연관되는지를 분석한다. 두 번째 예시는 대표성 휴리스틱 실험에서 “HTHTHTHT”와 “HTHHTHTT”와 같은 코인 토스 시퀀스에 대한 인지적 편향을, 복잡도 차이(K(HTHTHTHT) < K(HTHHTHTT))를 통해 설명한다. 세 번째 예시는 단기 기억 청킹 현상을 최소 복잡도 청크 형성으로 모델링하고, 실제 실험 데이터와 비교해 청크 경계가 복잡도 감소와 일치함을 확인한다.
또한, 복잡도 기반 모델 선택에 대한 논의를 포함한다. 기존의 AIC, BIC 등은 통계적 적합도와 패널티를 결합하지만, 알고리즘 복잡도는 모델 자체의 설명력을 직접 측정한다. ACSS를 이용하면 모델의 출력 문자열에 대한 K값을 계산해 베이즈 요인에 포함시킬 수 있어, 보다 객관적인 모델 비교가 가능하다.
결론적으로, 이 논문은 (1) 짧은 문자열에 대한 알고리즘 복잡도 추정이 실현 가능함을 증명하고, (2) 이를 심리학 연구에 적용할 수 있는 구체적인 도구와 방법을 제공하며, (3) 인간 인지·판단·기억 과정에서 복잡도와 무작위성의 역할을 정량적으로 탐구할 새로운 연구 패러다임을 제시한다. 앞으로 ACSS와 같은 도구가 심리학뿐 아니라 신경과학, 언어학, 행동경제학 등 다양한 분야에서 복잡도 기반 분석을 촉진할 것으로 기대된다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기