파라미터에 대한 무작위성의 경험적 의미와 레빈 반사전 측도

이 논문은 실수 파라미터 θ에 따라 정의되는 확률분포족 Pθ에 대해 알고리즘적 무작위성을 연구한다. 계산 가능한 Pθ가 효과적으로 강일관추정기를 가질 때, 레빈의 사전 반사전 반측도(Levin’s a‑priori semimeasure)가 Pθ‑무작위 열의 집합에 양의 값을 갖는 것은 θ가 계산 가능한 실수일 때와 동치임을 보인다. 또한 비계산 가능한 θ에 대해 베이지안 혼합이나 특수 확률 기계 등을 이용해 “의미 있는” Pθ‑무작위 열을 생성하…

저자: Vladimir Vyugin

본 논문은 실수 파라미터 θ 에 따라 정의되는 확률분포족 \(P_\theta\) 에 대해, 알고리즘적 무작위성 이론을 적용해 “무작위 열의 경험적 의미”를 정량화한다. 연구는 크게 네 부분으로 전개된다. 첫 번째 부분에서는 기본 개념을 정리한다. 반측도 \(P\) 는 \(P(\Lambda)\le1\) 및 \(P(x0)+P(x1)\le P(x)\) 을 만족하는 함수이며, 반측도 중에서 아래에서부터 반계산 가능한(semicomputable from below) 것들을 고려한다. 레빈은 이러한 반측도 중에서 곱셈 상수 c 에 의해 모든 다른 반측도를 지배하는 **보편 반측도** \(M\) (또는 \(\bar M\)) 를 정의하였다. \(\bar M\) 는 알고리즘적 무작위성의 “크기”를 측정하는 도구로, \(\bar M(A)=0\)이면 어떤 확률적 컴퓨터도 집합 \(A\) 내의 열을 양의 확률로 생성할 수 없음을 의미한다. 두 번째 부분에서는 파라미터화된 확률분포와 무작위성 정의를 확장한다. 파라미터 θ 가 실수이며 \(P_\theta\) 가 θ 에 대해 계산 가능하다고 가정한다(즉, θ 를 입력으로 하는 알고리즘이 \(P_\theta(x)\) 를 근사한다). 무작위성은 레빈의 반측도 \(M_\theta\) 와 결합해 정의되며, \(\omega\)가 \(P_\theta\)‑무작위라면 \(\sup_n M_\theta(\omega_n)P_\theta(\omega_n)<\infty\) 이다. 세 번째 부분이 논문의 핵심이다. 여기서는 **효과적으로 강일관추정기** \(\hat\theta\) 가 존재하는 경우를 다룬다. 강일관추정기란, 임의의 정밀도 ε와 오류 δ에 대해 computable 함수 \(N(ε,δ)\) 가 존재해 \(n\ge N\) 이면 \(|\hat\theta(\omega_n)-θ|<ε\) 가 δ 이하의 확률로 위반되지 않는다. 베르누이 분포 \(B_θ\) 의 경우 표본 평균이 이러한 추정기에 해당한다. 정리 1은 “\(\bar M(I_θ)>0\) ⇔ θ 가 계산 가능”임을 증명한다. 증명은 두 방향으로 진행된다. - **(⇒)** θ가 계산 가능하면 \(P_θ\) 자체가 계산 가능하고, 보편 반측도 \(M\) 에 의해 \(\bar M(I_θ)≥c·P_θ(I_θ)=c>0\) 가 된다. - **(⇐)** 반대로 \(\bar M(I_θ)>0\) 라고 가정하면, \(\bar M\) 가 양의 질량을 갖는 유한 집합 \(V\) 와 \(I_θ\) 의 교집합을 이용해 일련의 문자열 집합 \(X_n\) 을 구성한다. 각 \(X_n\) 은 길이가 충분히 크고, \(\hat\theta\) 값이 서로 2⁻ⁿ 이하 차이이며, \(\bar M\) 가 일정 수준 \(r\) 이상을 차지한다. 이러한 \(X_n\) 을 통해 \(\theta_n=\hat\theta(x)\) (사전 순 최소 문자열) 를 정의하면 \(|\theta_n-θ|<2^{-n}\) 가 성립한다. 따라서 θ 는 점근적으로 computable 하다. 핵심 아이디어는 \(\bar M(I_θ∩V)>\frac12\bar M(V)\) 라는 양의 차이를 이용해 \(\hat\theta\) 가 수렴하지 않을 경우 \(\omega\) 가 \(P_θ\)‑무작위가 아니게 되는 모순을 도출하는 것이다. 네 번째 부분에서는 **베이지안 혼합**과 **비무작위 파라미터**에 대한 추가 결과를 제시한다. - 정리 2는 computable prior \(Q\) 에 대해 베이지안 혼합 \(P(x)=\int P_θ(x)dQ(θ)\) 가 계산 가능하고, \(\bar M\bigl(\bigcup_{\theta\in R_Q} I_θ\bigr)>0\) 임을 보인다. 여기서 \(R_Q\) 는 \(Q\)‑무작위 θ 들의 집합이다. 즉, θ 자체가 비계산 가능하더라도, 그 θ가 어떤 computable prior 에 대해 무작위라면 해당 파라미터를 이용한 무작위 열은 베이지안 혼합을 통해 “의미 있게” 생성될 수 있다. - 정리 4(논문에서는 정리 5에 해당)에서는 **확률 기계**를 구성해, 거의 확실히 θ‑베르누이 무작위 열을 출력하도록 한다. 이때 θ는 각 computable measure 에 대해 무작위가 아니다. 이는 베이지안 접근이 모든 “의미 있는” 경우를 포괄하지 못한다는 점을 강조한다. 마지막으로 부록에서는 \(\bar M\) 가 마틴‑로뎃 무작위 열들의 집합에 대해 양의 값을 갖는 간단한 증명을 제공한다. 전체적으로 논문은 다음과 같은 의미 있는 결론을 도출한다. 1. 파라미터 θ 가 계산 가능할 때만, 해당 파라미터에 대한 무작위 열 집합이 레빈 반측도 관점에서 양의 “크기”를 가진다. 2. 베이지안 혼합을 통해 비계산 가능한 θ 라도, 그 θ 가 어떤 computable prior 에 대해 무작위라면 무작위 열을 생성할 수 있다. 3. 그러나 베이지안 방법만으로는 모든 의미 있는 경우를 설명할 수 없으며, 특수한 확률 기계가 비무작위 파라미터에 대해 무작위 열을 생성할 수 있음을 보인다. 이러한 결과는 전통적인 통계적 추정(강일관추정)과 알고리즘적 무작위성 이론 사이의 교차점을 명확히 하며, 파라미터가 비계산 가능하더라도 실험적(경험적) 의미를 가질 수 있는 조건을 제시한다는 점에서 이론적·실용적 의의를 가진다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기