희소성 제어를 통한 강인 비모수 회귀와 부하곡선 데이터 정제
초록
본 논문은 비모수 회귀 문제에 대하여 이상치(아웃라이어)를 희소성 제어를 통해 자동 검출하고 제거하는 방법을 제안한다. ℓ₀-노름 기반의 희소 모델을 ℓ₁-노름으로 완화하여 Lasso와 동등한 M-타입 추정량을 얻고, 전체 Lasso 경로를 탐색함으로써 최적의 정규화 파라미터를 선택한다. 비선형 스플라인에 적용한 결과, 전력 시스템의 부하곡선 데이터 정제에서 높은 정확도와 일반화 성능을 확인하였다.
상세 분석
논문은 먼저 비모수 회귀를 재현 커널 힐베르트 공간(RKHS)에서 정규화된 최소화 문제로 정의하고, 전통적인 최소제곱(LS) 손실이 이상치에 취약함을 지적한다. 이를 극복하기 위해 저자들은 변수 oᵢ(이상치)를 도입한 모델 yᵢ = f(xᵢ)+oᵢ+εᵢ를 제시한다. 여기서 oᵢ는 대부분이 0인 희소 벡터이며, ℓ₀-노름 제약을 통해 이상치 개수를 직접 제어한다. ℓ₀-노름 최적화는 NP‑hard이므로, 저자들은 ℓ₁-노름 완화로 전환하여 Lasso 형태의 비용함수를 얻는다. 이때 정규화 파라미터 λ는 희소성 수준을 조절하며, λ의 전체 경로를 계산하는 알고리즘(예: LARS)을 이용해 최적 λ를 데이터에 맞게 자동 선택한다. 또한 ℓ₀-노름을 비볼록 대체 함수(예: SCAD, MCP)로 교체함으로써 Lasso가 야기하는 편향을 감소시키고, 보다 정확한 함수 추정과 이상치 검출을 가능하게 한다. 이론적으로는 ℓ₀-제약 문제와 VLTS(가장 작은 s개의 잔차를 최소화) 문제 사이의 동등성을 증명하여, 제안 방법이 높은 breakdown point와 √N‑consistency를 유지함을 보인다. 실험에서는 얇은 판 스플라인과 sinc 함수 복원에 적용해 기존 방법 대비 RMSE와 이상치 검출률이 크게 향상됨을 확인하였다. 마지막으로 전력 시스템 부하곡선 데이터에 적용해, 자동으로 이상치를 식별하고 스플라인 기반 부드러운 곡선을 재구성함으로써 데이터 정제 과정에서 인간 개입을 최소화하고, 스마트 그리드 운영 의사결정에 필요한 정확한 부하 예측을 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기