비식별성에서 목표통합 역학습까지

본 연구는 파라메트릭 볼록 최적화 모델에서 역최적화 문제의 근본적인 한계와 이를 극복하기 위한 새로운 프레임워크를 제시한다. 먼저, 저자는 목표 함수 f(x,θ)=∑_{j=1}^p θ_j φ_j(x) 와 제약 집합 Ω={x∈ℝ^n | g_i(x)≤0, i=1,…,m} 을 가정한다. 여기서 θ∈ℝ_+^p 는 비음수이며 ‖θ‖_q=1 로 정규화한다(Assumption 3). φ_j는 연속 미분 가능한 볼록 기저함수이며, 선형 독립성과 최소 rank 조건을 만족한다(Assumption 1). g_i는 볼록·미분 가능하고 Slater 조건을 만족한다(Assumption 2). 역최적화는 관측된 결정 X={x_k}_{k=1}^K 가 전방 문제 FO(θ,Ω) 의 최적해에 가깝도록 파라미터 θ를 추정하는 문제이다. KKT 기반 모델 ICO (식 3)와 그 완화형 R‑ICO (식 5)는 각각 정확한 KKT 조건과 허용 오차 ε 를 적용한다. 그러나 이러한 모델은 변수·제약 수가 K 에 선형적으로 증가하고, 비선형·이중성(bilinearity) 때문에 전역 최적화가 NP‑hard인 구조적 한계를 가진다. 첫 번째 주요 기여는 비식별성(non‑identifiability)이 일반적인 현상임을 증명한 것이다. 선형 프로그램의 경우, 파라미터의 유일성은 모든 관측에 대해 활성 제약의 법선 벡터가 동일한 1‑차원 정상원(cone)을 형성할 때만 가능함을 정리 1에 명시한다. 실제 데이터에서는 두 개 이상의 비공선 법선이 동시에 활성화되는 경우가 흔히 발생하므로, 파라미터 집합 S 는 다차원 다면체가 된다(명제 2). 일반 볼록 모델에서도 정상원 차원과 기저함수의 선형 종속성이 비식별성을 야기한다(정리 2). 정규화와 정규화된 손실을 추가해도 파라미터 집합은 축소되지 않고 오히려 확대될 수 있다(Corollary 1). 식별 가능성을 확보하기 위한 충분·필요 조건으로 “직교 영구 자극(orthogonal persistent excitation)” 개념을 도입한다. 관측 행렬 Φ=

비식별성에서 목표통합 역학습까지

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기