네트워크 카운트 시계열을 위한 새로운 모델링 기법

네트워크 카운트 시계열을 위한 새로운 모델링 기법
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 기존의 일반화 네트워크 자기회귀(GNAR) 모델이 카운트 데이터에 부적합한 문제를 지적하고, 정수값 시계열 모델인 INAR과 GAR을 기반으로 한 두 가지 새로운 네트워크 카운트 시계열 모델(GNARI, NGNAR)을 제안한다. 모델의 확률적 특성, 2차 정상성 조건, 조건부 최소제곱 및 최대우도 추정법을 제시하고, 시뮬레이션과 뉴욕주 COVID‑19 양성자 수 데이터를 활용한 실증 분석을 통해 제안 모델이 기존 방법보다 예측 정확도가 우수함을 입증한다.

상세 분석

논문은 먼저 기존 GNAR 모델이 연속형 실수값을 전제로 하여 평균·분산이 독립적인 가정을 갖는 점이 낮은 카운트 데이터에 적용될 경우 음수 예측이나 과소·과대분산 문제를 야기한다는 한계를 명확히 제시한다. 이를 보완하기 위해 두 가지 모델을 설계한다. 첫 번째인 GNARI(Generalized Network Autoregressive Integer-valued) 모델은 INAR(정수값 자기회귀) 모델의 ‘thinning’ 연산을 네트워크 구조에 확장한다. 구체적으로 각 노드 i의 시점 t 값 X_{i,t}는 과거 자기회귀 항 α_{i,j}∘X_{i,t‑j}와 r‑단계 이웃들의 가중치 β_{j,r}∘(w_{i,q}∘X_{q,t‑j})의 합에 포아송 잡음 ϵ_{i,t}를 더한 형태이며, α,β는


댓글 및 학술 토론

Loading comments...

의견 남기기