고차원 함수 시계열 예측을 위한 해석 가능한 모델링

본 논문은 고차원 함수 시계열을 두 단계의 함수 ANOVA와 기능적 요인 모델로 분해하여, 지역·성별 등 관측 가능한 요인에 기반한 결정적 평균 구조와 시간에 따라 변동하는 잔차 과정을 명확히 구분한다. 이를 통해 해석 가능성을 유지하면서도 예측 정확도를 향상시키며, 일본의 지방별 연령·성별 사망률 데이터를 사례로 사용해 점예측 및 구간예측 성능을 검증한다.

저자: Han Lin Shang, Cristian F. Jiménez-Varón

본 논문은 고차원 함수 시계열(HDFTS)의 예측 문제를 다루면서, 데이터의 구조적 특성을 해석 가능하게 유지하는 새로운 모델링 프레임워크를 제안한다. 고차원 함수 시계열은 시간에 따라 관측되는 다수의 함수형 변수(예: 여러 지역·성별의 연령별 사망률)로 구성되며, 각 변수는 자체적인 시간 의존성을 가지면서 동시에 교차 섹션 간 상관관계를 나타낸다. 기존 연구에서는 주로 차원 축소를 위해 기능적 주성분 분석(FPCA)이나 기능적 요인 모델을 사용했으나, 이러한 방법은 얻어진 요인과 적재 행렬이 관측 가능한 요인(지역, 성별 등)과 직접 연결되지 않아 “블랙박스” 문제를 야기한다. ### 1. 연구 동기와 목표 - **해석 가능성 확보**: 정책 입안자와 실무자는 지역·성별 등 구체적인 요인이 어떻게 사망률에 영향을 미치는지 이해하고 싶어한다. - **예측 정확도 향상**: 결정적 구조와 잔차의 시계열 동역학을 동시에 모델링함으로써 예측 성능을 높이고자 한다. - **구간 예측의 신뢰성**: 모델 오차와 비정규성을 고려한 분포 자유 구간을 제공한다. ### 2. 데이터와 전처리 - **데이터**: 1975‑2023년 일본 47개 도도부현의 연령(0‑99세)·성별(남·여) 사망률 로그값. - **전처리**: 로그 변환 후 P‑스플라인(단조 제약)으로 부드럽게 보정, 결측 및 이상치를 보완. ### 3. 모델링 프레임워크 #### 3.1 두‑방향 함수 ANOVA (Two‑Way FANOVA) \

고차원 함수 시계열 예측을 위한 해석 가능한 모델링

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기