공통 정보의 새로운 시각: 하이퍼컨트랙티비티와 그래프 프로파일을 통한 정량적 분석
초록
이 논문은 Gács‑Körner의 “공통 정보” 개념을 정량화하고, 두 문자열 (x,y) (또는 두 확률변수) 사이의 상호 정보와 공통 정보의 차이를 메시지 길이 (|a|,|b|,|c|) 로 표현한다. 하이퍼컨트랙티비티 기법을 이용해 정량적 Gács‑Körner 정리를 증명하고, Hamming 거리 (\varepsilon n) 인 문자열 쌍에 대한 (|a|,|b|,|c|) 의 트레이드오프를 거의 정확히 구한다. 또한 “가장 나쁜” 분포를 구성해 프로파일의 하한을 보여준다.
상세 분석
논문은 먼저 “프로파일”이라는 새로운 조합론적 개념을 도입한다. 이 프로파일은 이분 그래프 (E\subseteq X\times Y) 에 대해 세 정수 ((\alpha,\beta,\gamma)) 가 존재하면, (|a|=\alpha,|b|=\beta,|c|=\gamma) 로 모든 엣지를 복원할 수 있음을 의미한다. 기존의 정보이론적 불평등 (|a|+|c|\ge H(X)n,;|b|+|c|\ge H(Y)n,;|a|+|b|+|c|\ge H(X,Y)n) 은 이 프로파일의 상한을 제공하지만, 동시에 만족시키는 경우가 거의 없다는 것이 Gács‑Körner 정리의 핵심이다.
이를 정량화하기 위해 저자들은 제품 공간에서의 하이퍼컨트랙티비티를 활용한다. 먼저 분포 (D) 에 대해 연산자 (T_D) 를 정의하고, (\delta(D)) 라는 파라미터를 도입한다. (\delta(D)>0) 은 (D) 가 “비퇴화(non‑degenerate)”임을 의미하며, (\delta(D)) 가 클수록 두 변수 사이의 상호 의존성이 강함을 나타낸다. 중요한 정리 1‑3은 (\delta(D)) 가 0이 아니면 (\Pr
댓글 및 학술 토론
Loading comments...
의견 남기기