정수값 자동회귀 모델 RINAR(p)의 이론과 응용

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 기존 INAR(p) 모델의 한계를 극복하고자, 실수값 AR(p) 구조를 그대로 정수값 시계열에 적용한 RINAR(p) 모델을 제안한다. 얇게 줄이는(thinning) 연산 대신 반올림 연산을 사용함으로써 혁신(innovation) 구조가 단순해지고, 회귀계수가 양·음 모두 가능해지며, 음수값 시계열 및 음의 자기상관도 표현할 수 있다. 정Stationarity와 ergodicity 조건을 제시하고, 최소제곱 추정량의 일관성을 증명한다. 시뮬레이션 및 실제 데이터 분석을 통해 모델의 적합성과 예측력을 검증한다.

상세 분석

RINAR(p) 모델은 실수값 AR(p) 과정 X_t = α_1 X_{t-1}+…+α_p X_{t-p}+ε_t 를 정수값 시계열에 그대로 옮겨온 형태로, 각 시점의 선형 결합값을 반올림(round) 연산을 통해 정수화한다는 점이 핵심이다. 이때 ε_t는 정수값 혁신으로, 일반적인 포아송 혹은 정규분포를 가정하지 않고 임의의 정수분포를 허용한다는 유연성을 가진다. 기존 INAR(p) 모델은 베르누이 얇게 줄이는 연산을 사용해 계수가 0~1 사이에 제한되었고, 음수값을 생성할 수 없었다. 반면 RINAR(p)에서는 α_i∈ℝ 로 자유롭게 설정 가능하므로, 음의 자기상관이나 음수 시계열을 자연스럽게 모델링한다.

정Stationarity는 |α_1|+…+|α_p|<1 조건으로 충분히 보장되며, 이는 실수 AR(p)와 동일한 수학적 구조를 공유한다. 또한, 마코프 체인 이론을 이용해 전체 과정이 강하게 ergodic임을 증명한다. 추정 측면에서는 최소제곱법(LS)으로 파라미터를 추정하고, 식별성(identifiability) 조건—특히 회귀계수 벡터가 0이 아닌 경우와 혁신의 평균이 0이 아닌 경우—하에 일관성을 확보한다. 증명 과정에서 반올림 연산이 비선형이지만, 큰 표본에서는 평균 제곱오차가 0에 수렴함을 보인다.

시뮬레이션에서는 다양한 α 벡터와 혁신 분포(포아송, 이항, 정규 근사)를 설정해 LS 추정량의 편향과 분산을 평가하였다. 결과는 표본 크기가 200 이상이면 추정량이 거의 무편향이며, 평균제곱오차가 이론적 한계에 근접함을 보여준다. 실제 데이터로는 일일 교통사고 건수와 주식 거래량을 분석했으며, RINAR(p)가 기존 INAR(p)와 ARIMA 모델보다 AIC/BIC 기준에서 우수하고, 예측 정확도(MAPE)에서도 개선을 보였다.

이 논문은 정수값 시계열 모델링에 새로운 패러다임을 제시한다. 반올림 연산을 통한 모델링은 구현이 간단하고, 파라미터 해석이 직관적이며, 음수값을 허용함으로써 경제·재무·환경 데이터 등 다양한 분야에 적용 가능성을 열어준다. 다만, 반올림에 따른 비선형 왜곡이 극단적인 계수값에서 모델 안정성을 위협할 수 있으므로, 추후 연구에서는 강건 추정법이나 베이지안 접근법을 도입해 이러한 한계를 보완할 필요가 있다.

정수값 자동회귀 모델 RINAR(p)의 이론과 응용

초록

상세 분석

댓글 및 학술 토론

의견 남기기