정지 포커 플랑크 학습의 수렴 특성 규명

** 본 논문은 확률적 탐색 프로세스의 정지 확률밀도(steady‑state probability density)를 추정하기 위한 정지 포커‑플랑크(Stationary Fokker‑Planck, SFP) 알고리즘의 수렴 특성을 체계적으로 분석한다. 1. **문제 설정 및 이론적 배경** - 비용 함수 \(V(\mathbf{x})\) 를 최소화하는 고차원 최적화 문제를 Langevin 방정식 \(\dot x_n = -\partial V/\partial x_n + \varepsilon(t)\) 으로 모델링한다. 여기서 \(\varepsilon(t)\) 는 평균 0, 분산 \(2D\) 인 백색 잡음이다. - 정지 상태에서 조건부 확률밀도 \(p(x_n|\mathbf{x}_{\setminus n})\) 는 1차원 Fokker‑Planck 방정식 \(D\,\partial_x p + p\,\partial_x V =0\) 을 만족한다. 이는 연속적인 누적분포 \(y(x_n|\mathbf{x}_{\setminus n})\) 에 대해 2차 선형 미분방정식 \(d^2y/dx_n^2 + (1/D)\,\partial_x V\, dy/dx_n =0\) 으로 변환된다. 2. **정지 포커‑플랑크 샘플링(SFP) 알고리즘** - 누적분포 \(y\) 를 완전한 기저 \(\{\phi_l\}\) 위에 선형 결합 \(\hat y = \sum_{l=1}^L a_l \phi_l\) 으로 근사한다. 기저는 경계조건 \(y(L_{1,n})=0,\; y(L_{2,n})=1\) 을 만족하도록 선택한다(예: 사인 함수). - 내부 격점 \(L-1\) 에서 \(\partial V/\partial x_n\) 값을 계산하고, 이를 이용해 선형 연립방정식 \(A\mathbf{a}= \mathbf{b}\) 을 푼다. 여기서 \(A\) 는 기저의 미분값으로 구성된다. - 얻어진 \(\hat y\) 를 역변환(inversion) 방법으로 샘플 \(x_n^\*\) 을 생성하고, 변수 \(x_n\) 를 교체한다. 이 과정을 모든 변수에 대해 순차적으로 반복한다. 3. **수렴 이론** - 정지 상태 존재 조건: 비용 함수 \(V\) 가 연속이고 경계에서 특이점이 없으며, 확산 계수 \(D>0\) 이면 정규화된 정지 밀도가 존재한다(문헌

정지 포커 플랑크 학습의 수렴 특성 규명

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기