잠재 과정이 이끄는 일반화 선형 모델(​GLM) : 비대칭 이론, 예측 기법, 그리고 실제 적용

읽는 시간: 6 분
...

📝 Abstract

This paper introduces a class of generalised linear models (GLMs) driven by latent processes for modelling count, real-valued, binary, and positive continuous time series. Extending earlier latent-process regression frameworks based on Poisson or one-parameter exponential family assumptions, we allow the conditional distribution of the response to belong to a bi-parameter exponential family, with the latent process entering the conditional mean multiplicatively. This formulation substantially broadens the scope of latent-process GLMs, for instance, it naturally accommodates gamma responses for positive continuous data, enables estimation of an unknown dispersion parameter via method of moments, and avoids restrictive conditions on link functions that arise under existing formulations. We establish the asymptotic normality of the GLM estimators obtained from the GLM likelihood that ignores the latent process, and we derive the correct information matrix for valid inference. In addition, we provide a principled approach to prediction and forecasting in GLMs driven by latent processes, a topic not previously addressed in the literature. We present two real data applications on measles infections in North Rhine-Westphalia (Germany) and paleoclimatic glacial varves, which highlight the practical advantages and enhanced flexibility of the proposed modelling framework.

💡 Analysis

**

1. 연구 배경 및 기존 문헌과의 차별점

기존 연구주요 가정한계
Zeger (1988)조건부 1‑차·2‑차 모멘트만 지정, quasi‑likelihood완전한 확률분포 가정 부재
Davis et al. (2000)로그정규 AR(1) 잠재 과정 + 포아송잠재 효과가 덧셈 형태, γ‑분포 적용 어려움
Davis & Wu (2009)1‑parameter 지수족, 덧셈 잠재 효과, dispersion 파라미터 고정링크 함수에 강한 제약, γ·IG 등 양의 연속분포 불가능
Maia et al. (2021), Barreto‑Souza & Ombao (2022)준우도·복합우도 접근, 특정 잠재 과정만 고려일반화된 이론 부재, 예측 방법 미제시

본 논문은 위 한계를 다섯 가지 핵심 포인트로 극복한다.

  1. 곱셈형 잠재 효과(νₜ·h(xₜᵀβ)) → γ‑분포·IG‑분포 등 양의 연속값 모델링 가능.
  2. 분산 파라미터 ϕ를 모멘트 방식으로 추정, 기존 고정 가정 탈피.
  3. 링크 함수 제약 완화 – h(·)가 지수형이 아니더라도 이론이 성립.
  4. 예측·예보 프레임워크 제시 – 조건부 기대값 E(Yₜ₊ₕ|Yₜ) 계산법(폐쇄형·Monte‑Carlo) 제공.
  5. 다양한 잠재 과정(log‑normal AR(1), gamma AR(1), squared‑ARCH(1)) 실험을 통해 모델 선택의 유연성 강조.

2. 모델 정의 및 수학적 구조

  • 조건부 분포: Yₜ|νₜ ∼ EF(μₜ νₜ, ϕ) , μₜ = h(xₜᵀβ)
  • 잠재 과정: {νₜ}는 강하게 α‑mixing이며 E(νₜ)=1, E(νₜ²)<∞.
  • 링크 함수: h(·)는 canonical(예: 로그, 로그‑링크) 혹은 일반적인 역링크 가능.

이때 평균은 E(Yₜ)=μₜ, 분산은 Var(Yₜ)=ϕ V(μₜ νₜ) + μₜ² Var(νₜ) 로 분해돼, 잠재 과정의 자기상관이 관측값의 공분산에 직접 반영된다.

3. 점근 이론

  1. 강한 혼합성 가정(α‑mixing) + Peligrad‑Utev(1997) CLT 를 이용해
    \

📄 Content

선구적인 연구에서 Zeger(1988)는 약하게 정상(stationary)인 잠재 과정에 의해 구동되는 카운트 자료에 대한 회귀 모델을 제시하였다. 이때 잠재 과정이 주어졌을 때의 두 번째 조건부 모멘트(조건부 평균과 분산)만을 명시하고, 추론을 위해 준가능도(quasi‑likelihood) 추정 절차를 사용하였다. 조건부 포아송 분포를 가정한 유사한 접근법으로 Davis 등(2000)은 다음과 같이 정의되는 포아송 카운트 시계열 ({Y_t})를 연구하였다.

[ Y_t\mid \nu_t \sim \text{Poisson}\bigl(\exp{x_t^\top\beta+\nu_t}\bigr), ]

여기서 (\nu_t)는 평균 1, 유한한 분산을 갖는 로그정규 AR(1) 과정이며, (x_t)는 공변량 벡터, (\beta)는 회귀계수 벡터이다. 저자들은 잠재 과정을 무시하고 포아송 가능도만을 이용한 GLM 추정량의 점근정규성을 보장하는 조건을 제시하였다. 모델 (1)은 Chan & Ledolter(1995)에서도 연구되었으며, 그들은 파라미터 추정을 위해 Monte‑Carlo EM 알고리즘을 개발하였다. Sørensen(2019)은 주변분포에서 회귀 파라미터를, 복합가능도(composite likelihood) 접근법을 통해 잠재 과정 파라미터를 추정하는 2단계 절차를 제안하였다. Davis & Wu(2009)는 포아송 가정을 한 파라미터 지수족(Exponential Family, EF)으로 확장했으며, 특히 분산 파라미터가 알려진 음이항(Negative Binomial) 경우에 초점을 맞추었다. 확장된 모델은 정상이고 강하게 혼합(strongly mixing)된 잠재 과정 (\nu_t)가 주어졌을 때

[ Y_t\mid \nu_t \sim \text{EF}\bigl(\mu_t\nu_t,\phi\bigr),\qquad \mathbb{E}[Y_t\mid \nu_t]=\mu_t\nu_t, ]

와 같이 한 파라미터 지수족을 따른다고 가정한다. 여기서 (h(\cdot))는 링크 함수의 역함수이며, GLM 가능도가 볼록(concave)하고 (\mathbb{E}\bigl[h(x_t^\top\beta+\nu_t)\bigr]=h(x_t^\top\beta)) 를 만족한다. 포아송, 음이항, 정규 경우에는 이러한 함수가 존재한다. 저자들은 잠재 과정을 무시하고 GLM 가능도만을 이용했을 때 추정량의 점근정규성을 증명하였다.

다른 최근 연구로는 Maia 등(2021)이 잠재 과정에 의해 구동되는 준가능도 모델을 이용한 반파라메트릭 시계열 클래스를 제안했으며, Barreto‑Souza & Ombao(2022)는 감마 AR(1) 과정에 의해 구동되는 포아송 회귀를 복합가능도 추정법으로 개발하였다.

본 논문의 주요 목표는 잠재 과정에 의해 구동되는 유연한 GLM을 도입하여 카운트, 실수값, 연속, 양의 연속 시계열을 모두 다루는 것이다. 이를 위해 우리는 관심 시계열 ({Y_t})가 잠재 과정 ({\nu_t})가 주어졌을 때 두 파라미터 지수족을 따르고, 조건부 평균에 잠재 과정이 곱셈적으로 들어가며, 분산(정밀) 파라미터 (\phi)는 알려지지 않을 수도 있다고 가정한다. 우리는 GLM 추정량의 점근정규성을 확립하고, 파라미터 추정의 표준오차를 평가하기 위한 정확한 정보 행렬을 제공한다. 우리의 모델링은 Davis & Wu(2009) 모델과 다음과 같은 장점을 가진다.

  1. 곱셈적 잠재 효과를 도입함으로써 (2)와 같은 가법적 형태가 아니라, 감마 분포를 이용한 양의 연속 시계열 모델링이 가능해진다(자세한 내용은 Remark 2.1).
  2. 분산 파라미터 (\phi) 를 모멘트 방법으로 추정하도록 허용함으로써 모델의 유연성을 높였다.
  3. 링크 함수 (h(\cdot)) 가 지수형이 아닐 경우에도 가법적 구조에서는 곱셈형을 구현하기 어려워 Davis & Wu(2009)의 조건 (\mathbb{E}[h(x_t^\top\beta+\nu_t)]=h(x_t^\top\beta)) 등을 만족시키기 힘들다. 우리의 접근법에서는 이러한 제약이 사라진다.
  4. 잠재 과정에 기반한 예측 방법을 제시하였다. 현재 문헌에서는 이 부분이 다루어지지 않았다.
  5. 다양한 잠재 과정(로그정규 AR(1), 감마 AR(1), 제곱 ARCH(1))을 실험에 적용하였다. 경험적으로 감마 AR(1) 잠재 과정이 로그정규 AR(1)보다 더 나은 성능을 보이는 경우가 있다.

논문 구성

  • Section 2: 잠재 과정에 의해 구동되는 GLM 클래스와 기본 결과 제시.
  • Section 3: Peligrad & Utev(1997)의 강혼합 과정에 대한 중심극한정리(CLT)를 이용해 GLM 추정량의 점근정규성을 증명하고, 올바른 정보 행렬을 명시.
  • Section 4: 예측 및 예보 방법 제시.
  • Section 5: 독일 노르트라인‑베스트팔렌 주의 홍역 감염 사례와 고대 퇴적물(Varve) 연속 시계열을 이용한 두 실제 데이터 적용.
  • Section 6: 결론.

2. 잠재 과정에 의해 구동되는 GLM 클래스

우선 지수족(Exponential Family, EF) 에 속하는 확률변수 (Y)의 밀도(또는 질량)함수를

[ f(y;\theta,\phi)=\exp\Bigl{\frac{y\theta-b(\theta)}{\phi}+c(y,\phi)\Bigr}, ]

라고 정의한다. 여기서 (b(\cdot))는 두 번 미분 가능, (\theta)는 실수 파라미터, (\phi>0)는 분산(정밀) 파라미터, (S)는 지원(support)이다. EF 이론에 따르면

[ \mu\equiv\mathbb{E}[Y]=b’(\theta),\qquad \operatorname{Var}(Y)=\phi,b’’(\theta)=\phi,V(\mu), ]

이며 (V(\cdot))는 분산 함수이다. (\theta)는 (\mu)의 함수 (\theta=g(\mu)) 로 표현될 수 있다. 우리는 (Y\sim\text{EF}(\mu,\phi)) 라고 표기한다.

다음은 실험에 사용될 잠재 과정들의 정의이다.

2.1 로그정규 AR(1)

[ \nu_t=\exp(Z_t),\qquad Z_t=\rho Z_{t-1}+ \varepsilon_t,\ \ \varepsilon_t\sim N!\bigl(-\sigma^2/2,\sigma^2\bigr), ]

(\rho\in(-1,1)) 이면 ({Z_t})는 정상 AR(1)이며, (\nu_t)는 로그정규 분포를 갖는다.

[ \mathbb{E}[\nu_t]=1,\quad \operatorname{Var}(\nu_t)=e^{\sigma^2}-1,\quad \operatorname{corr}(\nu_{t+\ell},\nu_t)=\frac{e^{\sigma^2\rho^\ell}-1}{e^{\sigma^2}-1},\ \ell\ge1. ]

2.2 감마 AR(1) (GAR)

Sim(1990)이 제안한 GAR 과정은

[ \nu_t\mid \nu_{t-1}\sim\text{Gamma}\bigl(\sigma^{-2},\sigma^{-2}\rho,\nu_{t-1}+(1-\rho)\bigr), ]

(\rho\in(0,1)) 가 시간 의존성을 조절한다. GAR는 정상이며, 주변분포는 shape(=\sigma^{-2}), scale(=1) 인 감마 분포이다.

[ \operatorname{corr}(\nu_{t+\ell},\nu_t)=\rho^\ell,\qquad \ell\ge1. ]

2.3 제곱 ARCH(1)

[ Z_t=\sqrt{\omega+\rho Z_{t-1}^2},\varepsilon_t,\qquad \varepsilon_t\stackrel{iid}{\sim}N(0,1), ]

(\omega>0,\ \rho\in(0,1)). 여기서 (\nu_t=Z_t^2) 로 정의하면 (\mathbb{E}[\nu_t]=1) 가 되도록 (\omega=1-\rho) 로 설정한다. 또한 (\rho\in(0,1/\sqrt{3})) 로 제한하면 (\mathbb{E}[\nu_t^2]<\infty) 이며

[ \operatorname{corr}(\nu_{t+\ell},\nu_t)=\rho^\ell,\qquad \ell\ge1. ]


3. 모델 정의

잠재 과정 ({\nu_t}) 가 (\mathbb{E}[\nu_t]=1) 와 (\mathbb{E}[\nu_t^2]<\infty) 를 만족한다고 하자. 우리는 다음과 같은 조건부 지수족을 가정한다.

[ Y_t\mid \nu_t \sim \text{EF}\bigl(\mu_t\nu_t,\phi\bigr),\qquad \mu_t = h\bigl(x_t^\top\beta\bigr), ]

여기서

  • (h(\cdot)) 는 링크 함수의 역함수이며, GLM 가능도가 볼록하도록 선택한다.
  • (x_t) 는 차원 (p) 인 공변량 벡터(표본 크기 (n) 에 따라 변할 수 있음).
  • (\beta\in\mathbb{R}^p) 은 회귀계수, (\phi>0) 은 분산(정밀) 파라미터이다.

Remark 2.1: Davis & Wu(2009) 가 사용한 가법적 형태와 달리, 여기서는 곱셈적 형태 (\mu_t\nu_t) 를 채택하였다. 로그링크를 사용할 경우 두 접근법이 일치하지만, 감마·역가우시안 등 양의 연속 분포를 다루려면 곱셈적 형태가 필수적이다.

조건부 평균은

[ \mathbb{E}[Y_t\mid \nu_t]=\mu_t\nu_t, ]

이며 (\mathbb{E}[\nu_t]=1) 이므로 전체 평균은 (\mathbb{E}[Y_t]=\mu_t) 가 된다. 분산 함수

이 글은 AI가 자동 번역 및 요약한 내용입니다.

검색 시작

검색어를 입력하세요

↑↓
ESC
⌘K 단축키