무한 타자와 확률의 역설

이 논문은 무한히 많은 타자(또는 컴퓨터)가 임의의 문자열을 생성할 때, 전체 무한 집합에서는 목표 문자열이 반드시 생성된다는 고전적 직관과 달리, 각 유한한 부분집합에서 목표 문자열이 나타날 확률을 임의로 작게 만들 수 있음을 보인다. 이를 위해 재귀적(구성적) 수학의 “단일 피복 정리”를 이용해 계산 가능한 확률 분포를 구성하고, 그 분포가 고전적 확률론과 어떻게 충돌하는지 분석한다. 또한 목표 문자열 없이 임의 길이의 모든 문자열을 생성하…

저자: Maarten McKubre-Jordens, Phillip L. Wilson

본 논문은 “무한히 많은 원숭이가 무작위로 타자를 칠 때, 반드시 셰익스피어의 전 작품을 복제한다”는 전통적인 확률론적 직관을 재검토한다. 저자들은 이 직관이 고전적 확률론에서는 옳지만, 계산 가능성(constructive mathematics) 관점에서는 완전히 다른 해석이 가능함을 보인다. 1. **고전적 무한 원숭이 정리 재현** 알파벳 크기 |A|와 목표 문자열 길이 w를 두고, 각 원숭이가 독립적으로 균등 확률로 키를 누른다고 가정한다. 한 원숭이가 목표 문자열 T_w를 만들 확률은 (1/|A|)^w이며, m개의 원숭이 중 어느 하나라도 성공할 확률은 1‑(1‑(1/|A|)^w)^m이다. m→∞이면 이 확률은 1에 수렴한다. 따라서 “무한히 많은 원숭이 중 최소 하나는 반드시 목표를 만든다”는 고전적 결론이 도출된다. 2. **비균등 확률 분포와 첫 번째 변형** 균등 가정 대신 원숭이마다 다른 타자 확률을 부여한다. 저자는 Dirac 델타 함수를 이용해 p_k( m, ε ) 라는 실패 확률을 정의하고, 이를 통해 유한 m에 대해 성공 확률을 ε 이하로 만들 수 있음을 보인다. 그러나 이 방법은 확률 분포가 m에 의존한다는 한계가 있다. 3. **구성적 수학을 통한 핵심 정리** 논문의 핵심은 “단일 피복 정리”(singular covering theorem)를 이용해 **계산 가능한** 확률 분포를 구축하는 것이다. 정리 2에 따라, 임의의 ε>0에 대해 실수 구간 I_k (길이 |I_k|) 를 선택해 ∑|I_k| < -log(1‑ε) 를 만족하도록 할 수 있다. 이를 기반으로 p_k = exp(-|I_k|) 로 정의하면, 전체 무한 집합 M에 대해 ∏ p_k = 0, 즉 “모든 원숭이가 실패할 확률”이 0가 된다. 이는 고전적 직관과 일치한다. 4. **유한 부분집합에 대한 역설** 중요한 점은 위 확률 분포가 m에 독립적이라는 것이다. 따라서 어떤 유한한 m‑troop(첫 m마리 원숭이) 에 대해서도 성공 확률 P(m) = 1‑∏_{k=1}^m p_k 은 ε보다 작게 만들 수 있다. 즉, 무한히 많은 원숭이 중 반드시 성공이 보장되지만, 실제 실험자가 관찰 가능한 유한 표본에서는 목표 문자열을 찾을 확률을 임의로 작게 만들 수 있다. 이는 “경로병리적(probabilistically pathological) 분포”라 명명한다. 5. **목표 자유 쓰기** 목표 문자열을 미리 알 필요 없이, 길이 w인 모든 가능한 문자열을 리스트업하는 상황을 고려한다. 동일한 정리와 구성을 적용하면, 어떤 유한한 문자열 집합도 무한 원숭이 집합에서 “완전히” 생성될 확률을 arbitrarily small하게 만들 수 있다. Corollary 4는 이를 명시적으로 증명한다. 6. **경로병리적 분포의 빈도** Theorem 5는 ε‑경계 이하의 성공 확률을 갖는 분포들의 비율이 ε^m 으로 급격히 감소함을 보인다. 따라서 표본 크기 m을 충분히 크게 하면, 실제 실험에서 경로병리적 분포가 나타날 확률은 실질적으로 0에 가깝다. 이는 시뮬레이션 설계 시 “큰 표본”이 왜 중요한지를 이론적으로 뒷받침한다. 7. **논의와 향후 연구** 저자들은 이 결과가 컴퓨터 시뮬레이션, 무작위 알고리즘, 그리고 확률적 모델링에 중요한 함의를 가진다고 주장한다. 특히, 구성적 확률 이론이 고전 확률론과 충돌하는 지점을 명확히 보여줌으로써, 시뮬레이션에서 “경로병리적” 확률 분포가 발생하지 않도록 사전 검증이 필요함을 강조한다. 또한, 구성적 수학의 다양한 체계(예: 러시아 재귀 수학, 코시-리만 등)와 Kőnig의 보조정리 등과의 연관성을 탐구하는 것이 향후 연구 과제로 제시된다. 결론적으로, 무한히 많은 원숭이 집합에서는 목표 문자열이 반드시 생성된다는 고전적 직관은 유지되지만, 실제 관찰 가능한 유한 표본에서는 그 사건이 극히 드물게 나타날 수 있음을 논문은 수학적으로 증명한다. 이는 확률적 현상을 해석할 때 “무한”과 “계산 가능성” 사이의 차이를 명확히 인식해야 함을 시사한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기