다수 유리함수 합의 전역 최소화와 희소성 활용

본 논문은 다수의 유리함수 합을 전역적으로 최소화하는 문제를 다루며, 특히 변수 수가 10~100, 항의 개수가 10~100, 각 항의 차수가 10 이하인 경우에 초점을 맞춘다. 이러한 문제는 전통적인 비선형 최적화 기법으로는 전역 최적값을 보장하기 어렵고, 차원 저주와 연산 복잡도 때문에 실용적인 해법이 부족했다. 저자들은 이를 해결하기 위해 두 가지 핵심 아이디어를 제시한다. 첫째, 문제를 일반화 모멘트 문제(generalized moment problem, GMP)로 재구성하고, Lasserre 계층을 이용한 반정밀 반정밀(semidefinite) 완화로 변환한다. 둘째, 문제에 내재된 희소성(sparsity)을 체계적으로 활용해 SDP(semidefinite programming) 풀러가 다루어야 할 행렬 차원을 크게 줄인다. 1. **문제 정의와 가정** - 목표 함수는 \(\displaystyle f(x)=\sum_{i=1}^{m}\frac{p_i(x)}{q_i(x)}\) 형태이며, 여기서 \(p_i,q_i\)는 차수 ≤10인 다항식이다. - 정의역 \(K\)는 다항식 부등식 \(\{g_j(x)\ge0\}_{j=1}^{r}\) 로 정의된 콤팩트 반정밀 집합이며, Archimedean 조건을 만족한다. - 모든 분모 \(q_i(x)\)는 \(K\) 내에서 양의 하한 \(\epsilon>0\)을 가진다(즉, \(q_i(x)\ge\epsilon\)). 이 가정은 분모가 0이 되면서 발생할 수 있는 무한대 값을 방지한다. 2. **GMP‑SDP 변환 과정** - 각 유리항 \(\frac{p_i}{q_i}\)를 두 개의 측정 \(\mu_i^{(p)}\), \(\mu_i^{(q)}\) 로 치환한다. 즉, \(\int p_i\,d\mu_i^{(p)}\)와 \(\int q_i\,d\mu_i^{(q)}\) 형태로 표현한다. - 전체 목표는 \(\displaystyle \min_{\{\mu_i\}} \sum_i \frac{\int p_i\,d\mu_i^{(p)}}{\int q_i\,d\mu_i^{(q)}}\) 로 변환되며, 이는 선형 목표와 비선형 제약을 동시에 포함한다. - 비선형 제약을 완화하기 위해, 각 측정에 대한 모멘트 행렬 \(M_d(y)\)와 로컬라이징 행렬 \(M_{d-d_j}(g_j y)\) 를 정의한다. 여기서 \(d\)는 현재 계층의 차수이다. - 모멘트 행렬이 반정밀 양정(positive semidefinite)임을 강제함으로써, 원래 비선형 문제를 SDP 형태로 변환한다. 3. **희소성 활용** - **Correlative Sparsity**: 변수 간 상관관계를 그래프 \(G_c\) 로 모델링한다. 각 다항식이 포함하는 변수 집합을 노드로 하고, 변수들이 같은 항에 동시에 나타나면 엣지를 추가한다. 이 그래프의 클리크(완전 부분 그래프)를 찾아 블록 대각화된 모멘트 행렬을 만든다. - **Term Sparsity**: 각 항이 차지하는 변수 집합을 별도로 고려해, 항별로 독립적인 모멘트 변수 집합을 만든다. 이는 특히 항의 수가 변수보다 많을 때 유용하다. - 두 희소성 개념을 결합하면, 전체 SDP는 \(\sum_{k=1}^{K} \text{SDP}_k\) 형태의 작은 블록들로 분할된다. 각 블록은 차수 \(d\)에 따라 독립적으로 확장될 수 있어, 메모리와 계산량을 크게 절감한다. 4. **수렴 이론** - 논문은 다음 정리를 증명한다. *정리*: 위 가정 하에, 차수 \(d\)가 무한히 커질 때 Lasserre 계층의 최적값 \(v_d\)는 전역 최적값 \(v^\star\)에 단조 증가하며 수렴한다. - 증명은 기존 GMP 수렴 결과를 기반으로 하며, 희소성 기반 블록 구조가 추가적인 제약을 도입하지 않음을 보인다. 즉, 블록별 SDP가 각각 원래 GMP의 부분 문제와 동등함을 이용한다. - 또한, Archimedean 조건이 만족되면 최적해는 실제 측정으로 표현 가능하므로, 최적값의 한계가 존재한다. 5. **구현 및 실험** - **소프트웨어 스택**: GloptiPoly 3 (GMP 모델링), YALMIP (MATLAB 인터페이스), MOSEK (고성능 SDP 풀러) 를 사용한다. - **모델링 흐름**: 1. 변수와 제약을 선언하고, 각 유리항을 `ratpoly` 형태로 입력한다. 2. `sparse` 옵션을 활성화해 변수‑항 그래프를 자동 생성한다. 3. `moments` 함수를 호출해 모멘트와 로컬라이징 행렬을 자동 구축한다. 4. `msdp` 명령으로 SDP를 생성하고, MOSEK에 전달한다. - **테스트 베드**: - **케이스 1**: 변수 20, 항 30, 차수 8, 무작위 생성된 다항식. 최적값 오차 < 10⁻⁶, 계산 시간 2.3 s. - **케이스 2**: 변수 80, 항 90, 차수 10, 희소성 비율 0.15. 블록 수 12, 각 블록 차수 4~6. 전체 시간 18.7 s, 메모리 사용 1.2 GB. - **케이스 3**: 실제 공정 최적화 문제(반도체 공정 파라미터 45개, 비용 함수 55개의 유리항). 전역 최적값과 비교했을 때 0.0003% 차이, 시간 27 s. - 비교 대상인 전통적인 글로벌 탐색(Genetic Algorithm, Particle Swarm)과는 정확도에서 3~4자리 차이, 시간에서는 5~10배 빠른 성능을 보였다. 6. **한계와 향후 연구** - 현재 접근법은 분모가 양의 하한을 가져야 하는 제한이 있다. 분모가 0에 가까워지는 경우, 사전 스케일링이나 페널티 기법이 필요하다. - 희소성 그래프가 매우 촘촘하면 블록 분할 효과가 감소한다. 따라서 자동적인 변수 재배열 혹은 차원 축소 기법과의 결합이 필요하다. - 대규모 실시간 응용(예: 온라인 제어)에서는 SDP 풀러의 반복 호출 비용이 문제될 수 있어, 근사 SDP 혹은 저차원 라그랑주 이완(Lagrangian relaxation)과의 하이브리드 방법이 연구될 여지가 있다. 결론적으로, 이 논문은 다수 유리함수 합 최소화라는 복합 비선형 최적화 문제를 GMP‑SDP 프레임워크와 희소성 기반 블록 Lasser레 계층을 통해 전역적으로 해결할 수 있음을 이론적·실험적으로 입증한다. 공개 소프트웨어를 활용한 구현 가이드는 연구자와 실무자가 바로 적용할 수 있게 설계되었으며, 고차원·고밀도 문제에서도 실용적인 성능을 보여준다.

다수 유리함수 합의 전역 최소화와 희소성 활용

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기