비제어 유한 상태 채널 용량 상한의 새로운 접근법
초록
본 논문은 입력이 채널 상태에 영향을 미치지 않는 비제어 유한 상태 채널(FSC)의 용량을 직접 구하기 어려운 문제를 해결하고자, 지연된 채널 상태를 입력에 포함시켜 ‘지향 정보율(directed information rate)’을 정의한다. 이를 기반으로 피드백 유무에 관계없이 일련의 상한을 유도하고, 조건부 마코프 소스가 이 상한을 달성함을 보인다. 상한 계산은 평균 보상 단계(stochastic control) 문제로 변환되며, 보상 함수의 균등 연속성을 이용해 유한 상태·행동 공간으로 근사한다. 값 반복(value iteration) 알고리즘을 통해 수렴성을 보장하고, 근사 최적 정책과 수치적 상한을 제공한다.
상세 분석
비제어 유한 상태 채널(FSC)은 입력 신호가 채널 상태 전이 확률에 영향을 주지 않으며, 상태는 외부 프로세스에 의해 자유롭게 변한다. 이러한 특성 때문에 일반적인 채널 용량의 단일 문자(single‑letter) 표현을 얻기 어렵고, 기존 연구에서는 주로 하한·상한을 수치적으로 추정하는 방법에 의존해 왔다. 본 논문은 ‘지연된 채널 상태’를 입력 시퀀스에 포함시키는 새로운 모델링 기법을 제시한다. 구체적으로, 시점 t의 입력을 (X_t, S_{t‑d}) 형태로 확장함으로써, 입력과 상태가 동시에 관측되는 효과를 만든다. 이때 d는 임의의 지연값이며, d≥1이면 상태 정보가 실제 전송에 영향을 미치지 않으면서도 정보 흐름을 정량화할 수 있다.
이 확장된 입력을 이용해 ‘지향 정보율(I→)’을 정의한다. 지향 정보는 Massey의 directed information 개념을 차용한 것으로, 피드백이 존재할 경우 입력이 과거 출력에 의존하는 경우에도 정보 흐름을 정확히 측정한다. 논문은 I→(X^n,S^{n‑d}→Y^n)/n의 극한을 채널 용량의 상한으로 설정하고, 이를 최적화 문제로 전환한다. 핵심은 ‘조건부 마코프 소스’를 가정함으로써, 입력-상태 프로세스가 제한된 메모리(M)와 조건부 확률에 의해 완전히 기술될 수 있다는 점이다. 이렇게 하면 최적 입력 분포를 찾는 문제는 평균 보상 단계(stochastic control) 문제, 즉 ARSCP(average reward per stage control problem)와 동등해진다.
ARSCP는 상태공간을 ‘지연된 상태와 현재 출력의 결합’으로 정의하고, 행동공간을 ‘조건부 입력 분포’로 설정한다. 보상 함수는 바로 지향 정보율의 순간 기여이며, 논문은 이 보상이 ‘균등 연속(uniformly continuous)’임을 증명한다. 균등 연속성은 무한 상태·행동 공간을 유한히 근사할 수 있는 이론적 근거를 제공한다. 구체적으로, ε‑net을 이용해 상태와 행동을 각각 유한 집합으로 격자화하고, 격자화된 ARSCP를 값 반복(value iteration) 알고리즘으로 해결한다. 값 반복은 Bellman 방정식의 고정점을 찾는 과정이며, 논문은 ‘완만한(mild) 가정’—예를 들어 보상 함수가 유계이고 전이 확률이 연속적—하에 수렴성을 보장한다.
알고리즘이 수렴하면 얻어지는 정책은 ‘근사 최적 정책(near‑optimal stationary policy)’이며, 해당 정책에 의해 발생하는 지향 정보율은 원래 비제어 FSC의 용량 상한에 매우 근접한다. 따라서 이 방법은 기존에 복잡한 수치 최적화에 의존하던 접근법을, 제어 이론 기반의 체계적이고 계산 가능한 절차로 대체한다는 점에서 의미가 크다. 또한 피드백이 있는 경우와 없는 경우를 동일한 프레임워크 안에서 다룰 수 있어, 피드백 이득(feedback gain)을 정량적으로 평가하는 데도 활용 가능하다.
이러한 기여는 두 가지 측면에서 실용적이다. 첫째, 실제 통신 시스템에서 채널 상태가 외부 요인(예: 이동성, 환경 변화)으로 독립적으로 변하는 경우, 설계자는 이 상한을 이용해 코딩·변조 설계의 목표치를 설정할 수 있다. 둘째, ARSCP를 유한화하는 과정에서 발생하는 근사 오차는 ε‑net의 해상도에 의해 제어 가능하므로, 원하는 정확도에 맞춰 계산 복잡도를 조절할 수 있다. 전체적으로 본 논문은 비제어 FSC 용량 분석에 새로운 수학적 도구와 실용적 알고리즘을 제공함으로써, 정보 이론과 제어 이론의 융합 가능성을 보여준다.
댓글 및 학술 토론
Loading comments...
의견 남기기