다차원 배열 타원형 확률 변수와 크로네커 델타 공분산 구조
본 논문은 다차원 배열(array) 형태의 확률 변수를 정의하고, 이를 위한 타원형(elliptical) 밀도 함수를 제시한다. 특히 크로네커 곱(Kronecker product) 기반의 역크로네커 곱(inverse Kronecker product)과 R‑matrix 연산을 이용해 배열의 선형 변환을 단일 벡터 형태로 표현함으로써, 다차원 데이터의 공분산 구조를 m₁·m₂·…·m_i 차원의 Kronecker 델타 형태로 간소화한다. 이를 통해 …
저자: Deniz Akdemir
논문은 먼저 배열(array)이라는 개념을 정의한다. 배열 𝓧는 차원 (m₁, m₂, …, m_i) 를 갖는 실수 텐서이며, 원소 표기는 (𝓧)_{r₁r₂…r_i} 로 한다. 배열에 대한 기본 연산으로는 원소별 덧셈·스칼라 곱, 그리고 ‘R‑matrix multiplication’이라는 다차원 일반화된 행렬 곱이 소개된다. R‑matrix multiplication은 (A₁)₁·(A₂)₂·…·(A_i)ᵢ·𝓧 형태로, 각 A_j 는 m_j×n_j 행렬이며, 결과는 동일 차원의 배열이 된다. 이 연산은 기존 행렬 곱을 차원별로 독립적으로 적용하는 방식이며, 중요한 성질로 (A₁⊗ᵢA₂⊗ᵢ…⊗ᵢA_i)·vec(𝓧)=vec((A₁)₁·…·(A_i)ᵢ·𝓧) 가 있다.
다음으로 ‘역크로네커 곱(⊗ᵢ)’을 정의한다. 일반적인 크로네커 곱 ⊗ 와 달리 역크로네커 곱은 A⊗ᵢB = B⊗A 로 정의되며, 행렬식·트레이스·특잇값 등 여러 연산에 대해 친화적인 성질을 가진다. 예를 들어 |A⊗ᵢB| = |A|^{dim(B)}·|B|^{dim(A)} 와 (A⊗ᵢB)^{-1}=A^{-1}⊗ᵢB^{-1} 등이다. 이러한 도구를 이용해 배열 선형 변환을 단일 행렬 형태로 표현함으로써, 복잡한 다차원 연산을 벡터화한다.
배열 확률 변수는 각 원소가 실수형 확률 변수인 경우로 정의된다. 확률 밀도 f_{𝓧}(𝓧)는 비음수이며 전체 적분이 1이 되도록 한다. 두 배열 𝓧,𝓨의 결합밀도, 주변밀도, 조건부밀도 등은 기존 다변량 확률 이론과 동일하게 정의된다.
정규분포 부분에서는 표준 배열 정규 N_{m₁×…×m_i}(0,I) 를 정의하고, 밀도는 exp(−½‖𝓩‖²)/(2π)^{∏m_i/2} 로 제시한다. 일반적인 선형 변환 𝓧 = (A₁)₁·…·(A_i)ᵢ·𝓩 + M (M 은 상수 배열) 를 적용하면, 𝓧 의 밀도는
φ(𝓧;M,A₁,…,A_i) = (2π)^{-∏m_i/2} |A₁|^{-∏_{j≠1}m_j}…|A_i|^{-∏_{j≠i}m_j}
· exp{−½‖(A₁^{-1})₁·…·(A_i^{-1})ᵢ·(𝓧−M)‖²} 로 얻어진다. 여기서 공분산 행렬은 Kronecker 델타 형태, 즉 각 차원의 공분산이 독립적으로 곱해지는 구조를 가진다. 이는 파라미터 수를 크게 줄여 고차원 데이터에 적합한 모델을 만든다.
타원형(elliptical) 분포는 구형 대칭 커널 f(‖𝓧‖²) 로 정의된다. 구형 대칭 벡터 x는 x = r·u 로 표현되며, r 은 비음수 스칼라, u 는 단위 구면 위의 균등벡터이다. 커널 f와 r 의 pdf k(r) 사이 관계는 k(r)=2π^{k/2}Γ(k/2)^{-1} r^{k−1} f(r²) 로 주어진다. 이를 배열에 적용하면, 배열 타원형 밀도는
f_{𝓧}(𝓧;A₁,…,A_i,M) = f(‖(A₁^{-1})₁·…·(A_i^{-1})ᵢ·(𝓧−M)‖²)·|A₁|^{-∏_{j≠1}m_j}…|A_i|^{-∏_{j≠i}m_j}
가 된다.
특히 자유도 ν 를 갖는 배열 t‑분포를 정의한다. 밀도는
c·(1 + ‖(A₁^{-1})₁·…·(A_i^{-1})ᵢ·(𝓣−M)‖²/ν)^{-(ν+m)/2}·|A₁|^{-∏_{j≠1}m_j}…|A_i|^{-∏_{j≠i}m_j}
이며, 정규화 상수 c = (νπ)^{-m/2}·Γ((ν+m)/2)/Γ(ν/2) 로 주어진다. 여기서 m = ∏_{j=1}^i m_j 이다.
마지막으로, 배열 정규·타원형 분포의 모멘트, 주변·조건부 분포, 독립성 등은 모두 vec(𝓧) 를 이용한 기존 다변량 결과를 그대로 적용할 수 있음을 강조한다. 즉, 배열을 벡터화한 뒤 기존 이론을 사용하면 복잡한 다차원 구조를 손쉽게 분석할 수 있다.
결론적으로, 이 논문은 배열 형태의 확률 변수를 체계적으로 정의하고, 역크로네커 곱과 R‑matrix 연산을 통해 선형 변환을 단일 행렬로 표현함으로써, 고차원 다중모드 데이터에 적합한 정규·타원형 분포 모델을 제공한다. Kronecker 델타 공분산 구조는 파라미터 차원을 크게 감소시키면서도 데이터의 다차원 상호작용을 보존한다는 장점을 가진다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기