전체 정보 사슬 이론을 향한 질문 난이도 연구

초록

본 논문은 의사결정에서 최적 정보 획득 문제를 다루며, 질문을 파라미터 공간의 분할로 정의하고 그 난이도를 실수값 함수로 정량화한다. 합리적 공리들을 만족하는 형태를 유도한 결과, 등방성 가정 하에 난이도 함수는 파라미터 공간상의 단일 스칼라 함수에만 의존하며, 이를 온도와 유사한 물리량으로 해석한다. 또한 서로 다른 질문 간 난이도 관계식도 제시한다.

상세 분석

논문은 먼저 정보 획득이 의사결정 성능에 미치는 영향을 정량화하려는 필요성을 제시한다. 이를 위해 질문을 ‘문제 파라미터 공간을 분할하는 집합’으로 모델링하고, 각 질문에 대해 ‘난이도 함수’를 정의한다. 난이도 함수는 실수값이며, 질문이 얼마나 정확한 답변을 요구하는지를 측정한다. 저자는 난이도 함수가 만족해야 할 일련의 공리—(1) 비음성, (2) 동일 파라미터에 대한 질문은 동일 난이도, (3) 부분 질문의 난이도는 전체 질문 난이도의 하위 집합, (4) 독립 질문들의 난이도는 가법적 결합—를 제시한다. 이러한 공리들을 수학적으로 풀면, 난이도 함수는 파라미터 공간 Ω 위의 가중치 함수 w(ω)와 질문 분할 {A_i}의 측도 μ(A_i) 사이의 곱 형태, 즉 D(Q)=∑_i μ(A_i)·w(ω_i) 로 표현된다. 등방성(모든 방향에서 동일) 가정을 추가하면 w(ω) 가 Ω 전체에 걸쳐 상수값 T와 동일하게 된다. 이때 T는 ‘온도‑유사량’으로 해석되며, 질문 난이도 D는 열역학에서의 내부 에너지와 유사한 역할을 한다. 즉, 높은 온도 영역에서는 동일한 질문이라도 더 큰 난이도를 갖게 된다. 논문은 또한 두 질문 Q₁, Q₂ 사이의 난이도 차이를 정보 엔트로피와 유사한 형태로 나타내어, 질문 간 상호작용을 정량화한다. 이러한 결과는 정보 소스가 제공할 수 있는 정확도와 비용을 사전에 예측하고, 최적의 질문 선택을 위한 이론적 기반을 제공한다.