디지털 이미지 픽셀 정보량의 정수 추정 방법

초록

본 논문은 픽셀 단위의 정보량을 정수값으로 추정하기 위해 이진 계층 구조를 이용한 클러스터링 기법을 제안한다. 계층적 이미지 근사열을 생성하고, 표준편차 기준으로 원본 이미지와의 차이를 최소화하는 알고리즘을 개발하였다. 실험을 통해 제안 방법의 정수 추정값을 기존의 연속형 엔트로피 공식과 비교 분석하였다.

상세 분석

이 논문은 디지털 이미지 처리 분야에서 정보량을 정량화할 때 흔히 사용되는 연속형 엔트로피 공식(예: Shannon, Hartley)과는 달리, 픽셀 하나당 정수값으로 정보를 표현하려는 새로운 패러다임을 제시한다. 핵심 아이디어는 이미지 전체를 이진 트리 형태의 계층 구조로 분할하고, 각 노드가 픽셀 클러스터를 나타내도록 하는 것이다. 트리의 루트는 전체 이미지 전체를 하나의 클러스터로 보고, 하위 레벨로 갈수록 클러스터를 두 개의 서브클러스터로 분할한다. 이때 분할 기준은 클러스터 내부의 색상(또는 회색조) 분산을 최소화하면서, 두 서브클러스터 간의 평균값 차이가 최대가 되도록 하는 ‘최소 분산·최대 차이’ 원칙을 적용한다.

각 픽셀은 트리에서 자신이 속한 모든 노드의 깊이(depth)만큼의 비트를 할당받는다. 즉, 루트에서부터 해당 픽셀이 속한 리프 노드에 이르기까지 거치는 분할 단계 수가 바로 그 픽셀의 정보량 정수값이다. 이 정의는 정보량이 0인 경우(전체 이미지가 균일한 경우)부터 시작해, 이미지가 복잡해질수록 깊이가 늘어나 정보량이 증가한다는 직관적인 해석을 제공한다.

논문은 이러한 이진 계층을 효율적으로 구축하기 위한 두 가지 알고리즘을 제안한다. 첫 번째는 ‘그리디 분할’ 방식으로, 현재 클러스터의 분산이 사전에 정의된 임계값을 초과하면 즉시 두 서브클러스터로 나누는 방법이다. 두 번째는 ‘전역 최적화’ 방식으로, 전체 트리 구조를 탐색하면서 전체 평균 표준편차를 최소화하는 분할 조합을 찾는다. 전자는 계산량이 적어 실시간 처리에 적합하고, 후자는 최적의 정보량 추정을 제공하지만 연산 비용이 높다.

또한, 논문은 계층적 이미지 근사열을 생성한다. 각 트리 레벨에 해당하는 이미지 근사는 해당 레벨에서의 클러스터 평균값을 모든 픽셀에 할당함으로써 얻어진다. 이렇게 얻은 근사열은 레벨이 증가할수록 원본 이미지와의 표준편차 차이가 감소한다. 특히, 특정 레벨에서의 표준편차가 최소가 되는 지점을 찾음으로써, 원본 이미지와 가장 유사한 정수 기반 근사 이미지를 선택할 수 있다.

실험에서는 표준 테스트 이미지(예: Lena, Barbara, Cameraman)를 사용해 제안된 정수 정보량과 기존 Shannon 엔트로피, Hartley 공식에 의해 계산된 연속형 정보량을 비교하였다. 결과는 정수 추정값이 이미지의 복잡도와 시각적 디테일을 잘 반영하며, 특히 저비트 압축 상황에서 정보량을 정수형으로 표현하는 것이 압축 효율과 복원 품질을 동시에 개선할 수 있음을 보여준다. 또한, 계층적 근사 이미지가 표준편차 기준으로 원본에 가장 근접하는 레벨을 자동으로 선택함으로써, 이미지 분석 및 압축 파이프라인에 손쉬운 정량적 기준을 제공한다는 점에서 실용성이 강조된다.

이 논문의 주요 공헌은 (1) 픽셀 수준의 정보량을 정수값으로 정의하는 새로운 수학적 모델, (2) 이를 구현하기 위한 효율적인 이진 클러스터링 계층 구축 알고리즘, (3) 표준편차 최소화를 통한 최적 근사 이미지 선택 방법, (4) 기존 연속형 정보량 모델과의 정량적 비교를 통한 모델 검증이다. 이러한 접근은 디지털 이미지의 내용 기반 검색, 압축, 그리고 머신러닝 전처리 단계에서 정수형 메타데이터를 활용할 수 있는 새로운 가능성을 열어준다.