PL conditions do not guarantee convergence of gradient descent-ascent dynamics
๐ Abstract
**
์ด ๋
ผ๋ฌธ์ ๋ ๋ณ์โฏ(x)์โฏ(y)์ ๋ํด ์ ์๋ ํจ์โฏ(f(x,y))๊ฐ ์์ชฝ Polyakโลojasiewicz (PL) ์กฐ๊ฑด์ ๋ง์กฑํจ์๋ ๋ถ๊ตฌํ๊ณ , gradient descentโascent (GDA) ์ฐ์ ํ๋ฆ์ด ํด๋น ํจ์์ ์์ฅ์ (saddle point)์ผ๋ก ์๋ ดํ์ง ์๊ณ ์ฃผ๊ธฐ์ ์ธ ๊ถค๋๋ฅผ ๊ทธ๋ฆฌ๋ฉฐ ํ์ ํ๋ค๋ ๋ฐ๋ก๋ฅผ ์ ์ํ๋ค. ์ ์๋ ์์ ์ ์ ์ผํ ์๊ณ์ ์ด ์กด์ฌํ๊ณ , ์ ์ญ์ ์ผ๋ก๋ PL ์์ (C<\infty)๊ฐ ์กด์ฌํ์ง๋ง, ์ด๊ธฐ๊ฐ์ ์ ์ ํ ์ ํํ๋ฉด ํ๋ฆ์ด ์์ ์ฃผ์์์ ์๊ตฌ์ ์ผ๋ก ์ํํ๋ค๋ ์ฌ์ค์ ์ฆ๋ช
ํ๋ค. ๋ํ, ๊ฐ์ PL ์กฐ๊ฑด์ด ์ง์ญ์์๋ ์์ฅ์ ์ผ๋ก์ ์๋ ด์ ๋ณด์ฅํ๋ค๋ ๊ธฐ์กด ๊ฒฐ๊ณผ๋ฅผ ์ฌํ์ธํ๋ค.
**
๐ก Deep Analysis
**
1. ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋๊ธฐ
- PL ์กฐ๊ฑด์ ๋น๋ณผ๋ก ํจ์์์๋ ์ ํ ์๋ ด์ ๋ณด์ฅํ๋ ๊ฐ๋ ฅํ ๋๊ตฌ๋ก, ์ต์ ํ ์ด๋ก ์์ ๋๋ฆฌ ํ์ฉ๋๋ค.
- ๋ฏธ๋๋งฅ์ค(minโmax) ๋ฌธ์ ์ GAN ๋ฑ์์ ๋ฑ์ฅํ๋ ์์ฅ์ ์ฐพ๊ธฐ๋ gradient descentโascent (GDA) ๋ก ์ ๊ทผํ๋ค.
- ๊ธฐ์กด ์ฐ๊ตฌ๋ ๊ฐํ ๋ณผ๋กโ์ค๋ชฉ(strongly convexโconcave) ํน์ ๋จ์ผ ๋ณ์์ ๋ํ ๊ฐํ ๋ณผ๋ก์ฑ์ ๊ฐ์ ํ๋ฉด GDA๊ฐ ์ ์ญ ์๋ ดํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค.
- ๋โ์ธก๋ฉด PL ์กฐ๊ฑด(์์ชฝ ๋ณ์์ ๋ํด ๊ฐ๊ฐ PL์ ๋ง์กฑ)๋ ์๊ฐ ์ค์ผ์ผ ๋ถ๋ฆฌ ํน์ ๋โ์๊ฐ ์ค์ผ์ผ ์๊ณ ๋ฆฌ์ฆ์ ํตํด ์๋ ด์ ๋ณด์ฅํ๋ค๋ ๊ธฐ๋๊ฐ ์์์ง๋ง, ์ ์ญ์ ์ธ ๋ณด์ฅ์ ์์ง ์ฆ๋ช ๋์ง ์์๋ค.
2. ์ฃผ์ ๊ธฐ์ฌ
| ๊ตฌ๋ถ | ๋ด์ฉ |
|---|---|
| ๋ฐ๋ก ์ ์ | ์์ ์ ์ ์ผํ ์์ฅ์ ์ ๊ฐ๋ ํจ์ (f)๋ฅผ ๋ช ์์ ์ผ๋ก ๊ตฌ์ฑํ๊ณ , ์ด ํจ์๊ฐ ๋โ์ธก๋ฉด PL ์กฐ๊ฑด์ ๋ง์กฑํจ์ ์ฆ๋ช ํจ. |
| ์ฃผ๊ธฐ์ ํ๋ฆ | GDA ํ๋ฆ (\dot{x}=-\nabl$a_x$ f,\ \dot{y}= \nabl$a_y$ f) ๊ฐ ์ด๊ธฐ๊ฐ์ด ( |
๐ Full Content
ํ๊ตญ์ด ๋ฒ์ญ (์ต์ 2,000์)
์๋๋ ์๋ฌธ์ ํ๊ตญ์ด๋ก ๋ฒ์ญํ ๋ด์ฉ์ด๋ฉฐ, ์์๊ณผ ๊ธฐํธ๋ ์๋ฌธ ๊ทธ๋๋ก ์ ์งํ์ต๋๋ค.
ํจ์ (f\colon \mathbb{R}^{d}\to \mathbb{R}) ๊ฐ ์๋๋ก ์ ๊ณ(bounded from below)์ผ ๋, ๋ค์๊ณผ ๊ฐ์ ์์ (C<+\infty) ๊ฐ ์กด์ฌํ์ฌ ๋ชจ๋ (z\in\mathbb{R}^{d}) ์ ๋ํด
[ \frac12|\nabla f(z)|^{2}\ge C\bigl(f(z)-\inf_{x}f(x)\bigr) \tag{1.1} ]
์ ๋ง์กฑํ๋ฉด, (f) ๊ฐ Polyakโลojasiewicz (PL) ์กฐ๊ฑด์ ๋ง์กฑํ๋ค๊ณ ํ๋ค[8,14].
์ด ์กฐ๊ฑด ํ์์๋ ๋ชจ๋ ๊ฒฝ์ฌ ํ๊ฐ(gradient descent) ๊ถค์ ์ด ์ ํ ์๋(linear speed)๋ก (f) ์ ์ต์์ ์ผ๋ก ์๋ ดํ๋ค[5]. ์์ฐ์ค๋ฌ์ด ์ง๋ฌธ์, ์ ์ฌํ ์กฐ๊ฑด์ด ์์ฅ์ (saddleโpoint) ๋ฌธ์ ์ ๋ํด์๋ ์๋ ด์ ๋ณด์ฅํ ์ ์๋๊ฐ ํ๋ ๊ฒ์ด๋ค.
[ \min_{x\in X}\max_{y\in Y} f(x,y) ]
์ ๊ฐ์ ํํ์ ๊ทน์โ๊ทน๋(minโmax) ์ต์ ํ ๋ฌธ์ ๋ ๊ฐ์ธ ์ต์ ํ[1]์ ์์ฑ์ ์ ๋ ์ ๊ฒฝ๋ง(GAN)[4] ๋ฑ ๋ค์ํ ๋งฅ๋ฝ์์ ๋ฑ์ฅํ๋ค. ์ฌ๊ธฐ์๋ ํธ์์ (X) ์ (Y) ๋ฅผ ์ ํด๋ฆฌ๋ ๊ณต๊ฐ์ด๋ผ๊ณ ๊ฐ์ ํ๋ค. ์์ฅ์ ์ ์ฐพ๊ธฐ ์ํ ์์ฐ์ค๋ฌ์ด ์ ์ฐจ๋ ((- \nabla_{x}f,;\nabla_{y}f)) ๋ฐฉํฅ์ผ๋ก ์์ ์คํ ์ ๋ฐ๋ณต์ ์ผ๋ก ์ทจํ๋ ๊ฒ์ด๋ค. ์คํ ํฌ๊ธฐ๊ฐ ๋ฌดํํ ์์์ง๋ ๊ทนํ์์๋ ๊ฒฝ์ฌ ํ๊ฐโ์์น(gradient descentโascent, GDA) ํ๋ฆ
[ \dot z(t)=\bigl(-\nabla_{x}f(z(t)),;\nabla_{y}f(z(t))\bigr),\qquad t\ge 0 \tag{1.2} ]
์ ์ฐ๊ตฌํ๋ ๊ฒ๊ณผ ๋๋ฑํ๋ค.
๋ง์ฝ ({f(\cdot ,y)}{y\in Y}) ๊ฐ ๊ท ์ผํ๊ฒ ๊ฐ๋ณผ๋ก(uniformly strongly convex) ํ๊ณ , ({f(x,\cdot )}{x\in X}) ๊ฐ ๊ท ์ผํ๊ฒ ๊ฐ์ค๋ชฉ(uniformly strongly concave) ํ๋ฉด, GDA ํ๋ฆ์ (f) ์ ์์ฅ์ ์ผ๋ก ์๋ ดํจ์ ๋ณด์ผ ์ ์๋ค[2]. ๋ฐ๋ฉด, (f) ๊ฐ ๋จ์ํ ๋ณผ๋กโ์ค๋ชฉ(convexโconcave) (โ๊ฐโ์ด๋ผ๋ ์์์ด๊ฐ ์๋) ๊ฒฝ์ฐ์๋ GDA ํ๋ฆ์ด ์๋ ดํ์ง ์๋ ๋ฐ๋ก๊ฐ ์กด์ฌํ๋ค. ์๋ฅผ ๋ค์ด (f(x,y)=xy) ๋ก ์ ์ํ๋ฉด ํ๋ฆ์ ์์ ์ ์ค์ฌ์ผ๋ก ์์ ๊ทธ๋ฆฌ๋ฉฐ ์ํํ๋ค. ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ , ์์ํ ๋ณผ๋กโ์ค๋ชฉ ์กฐ๊ฑด ํ์์๋ ์ธ๋ถ ๊ธฐ์ธ๊ธฐ๋ฒ(extragradient method) ๊ณผ ๊ฐ์ 1์ฐจ ์๊ณ ๋ฆฌ์ฆ์ (์กด์ฌํ๋ค๋ฉด) ์์ฅ์ ์ ์ฐพ๋ ๋ฐ ์ฑ๊ณตํ๋ค[6].
๊ฐ๋ณผ๋กโ๊ฐ์ค๋ชฉ ๊ฐ์ ์ ์ํํ๋ ค๋ ์ฐ๊ตฌ๊ฐ ํ๋ฐํ ์งํ๋์ด ์์ผ๋ฉฐ, ์๋ฅผ ๋ค์ด ํ ๋ณ์์๋ง ๊ฐ๋ณผ๋ก์ฑ์ ๋ถ์ฌํ๊ฑฐ๋[์: ({f(\cdot ,y)}) ์๋ง ๊ฐ๋ณผ๋ก์ฑ ๋ถ์ฌ] ํน์ PL ์กฐ๊ฑด์ ๋์ ํ๋ ๋ฐฉ๋ฒ์ด ์๋ค[3,7,9,12,18]. ์ฌ๊ธฐ์๋ ๋ ๋ฒ์งธ ์ ๊ทผ๋ฒ์ ์ด์ ์ ๋ง์ถ๋ค.
์ฐ๋ฆฌ๋ ์๋ฉด PL(twoโsided PL) ์กฐ๊ฑด์ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํ๋ค.
[
\text{ํจ์ }f\text{ ๊ฐ } {f(\cdot ,y)}{y\in Y}\ \text{์}\ {-f(x,\cdot )}{x\in X}\text{ ๊ฐ ๋ชจ๋ ๋์ผํ ์์ }C<+\infty\text{ ๋ก PL ์กฐ๊ฑด์ ๋ง์กฑํ๋ค๋ฉด, }f\text{ ๋ ์๋ฉด PL์ ๋ง์กฑํ๋ค.}
]
์ด ์กฐ๊ฑด ํ์์, ๋ณํ๋ GDA ํ๋ฆ์ [3,18] ์์ ์์ฅ์ ์ผ๋ก ์๋ ดํจ์ด ๋ณด์๋ค. ๋ณํ์ ์๊ฐ ์ฒ๋(timeโscale)์ ์ถฉ๋ถํ ํฐ ๋ถ๋ฆฌ๋ฅผ ์๊ตฌํ๋ค; ์ฆ ๋ณ์ (x) ์ (y) ๊ฐ ์๋ก ๋ค๋ฅธ ์๋๋ก ์งํํ๋๋ก ์ค๊ณํ๋ค[7,9,12]. ๋ ๋ค๋ฅธ ๊ธ์ ์ ์ธ ๊ฒฐ๊ณผ๋, ์๋ฉด PL ์กฐ๊ฑด์ด ์์ ๋ ์ด๊ธฐํ๊ฐ ์ถฉ๋ถํ ์์ฅ์ ๊ทผ์ฒ์ ์์ผ๋ฉด ์๋์ GDA ํ๋ฆ(1.2) ์์ฒด๋ ์์ฅ์ ์ผ๋ก ์๋ ดํ๋ค๋ ๊ฒ์ด๋ค(์๋ Propositionโฏ1.2 ์ฐธ๊ณ ).
์ด๋ฌํ ๊ฒฐ๊ณผ๋ค์ ๊ณ ๋ คํ๋ฉด, ์๋ฉด PL ์กฐ๊ฑด์ด ์ค์ ๋ก ์ ์ญ(global) ์๋ ด์ ๋ณด์ฅํ ๊ฒ์ด๋ผ๊ณ ๊ธฐ๋ํ ์ ์๋ค(์์ฅ์ ์ด ์กด์ฌํ๋ค๋ ๊ฐ์ ํ์). ๊ทธ๋ฌ๋ ๋ณธ ๋ ผ๋ฌธ์ ํต์ฌ์ ๊ทธ ๊ธฐ๋๊ฐ ํ๋ ธ์์ ๋ณด์ด๋ ๋ฐ๋ก๋ฅผ ์ ์ํ๋ ๊ฒ์ด๋ค.
์ ๋ฆฌ 1.1 (๋ฐ๋ก)
(R) ์ ์์ ์ ์ ์ผํ ์๊ณ์ (critical point)์ ๊ฐ์ง๋ฉฐ, ์ด๋ค ์์ (C<+\infty) ๊ฐ ์กด์ฌํ์ฌ ๋ชจ๋ ((x,y)\in[-1,1]^{2}) ์ ๋ํด
[ \frac12|\nabla f(x,y)|^{2}\ge C\bigl(f(x,y)-\inf_{z}f(z)\bigr) \tag{1.3} ]
์ ๋ง์กฑํ๋ค. ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ , ([-1,1]^{2}) ์ ์ด๋ค ์ด๋ฆฐ ๋ถ๋ถ์งํฉ์ ์ํ๋ ์ด๊ธฐ๊ฐ (z(0)) ์ ๋ํด GDA ํ๋ฆ (1.2)์ ์ฃผ๊ธฐ์ (periodic) ์ผ๋ก ์์ง์ธ๋ค.
์ฆ, (1.3)์ ๋ง์กฑํ๊ณ ์๊ณ์ ์ด ์กด์ฌํ๋ค๋ฉด(์: (\nabla f(0,0)=0)), ๊ทธ ์๊ณ์ ์ ์์ฅ์ ์ด๋ค. ์ค์ ๋ก ๋ชจ๋ ((x,y)\in[-1,1]^{2}) ์ ๋ํด
[ \partial_{x}f(x,y)=0\quad\Longrightarrow\quad \partial_{y}f(x,y)\neq0, ]
๋ฑ์ด ์ฑ๋ฆฝํ๋ค.
์ ๋ฆฌโฏ1.1 ์์ ์ฌ์ฉ๋ ํจ์ (f) ๋ ๊ทธ๋ฆผโฏ1์ ๋ํ๋ ์๋ค(๋ณ์๋ค์ ([-1,1]^{2}) ๋ก ๋ค์ ์ค์ผ์ผ๋งํ ๋ฒ์ ). ์์ ๊ทผ์ฒ์์๋
[ f(x,y)=\gamma^{2}x^{2}+xy-\gamma^{2}y^{2}, ]
์ฌ๊ธฐ์ (\gamma\approx0.2531) ์ด๋ค. ์ด ํํ๋ ์์ ๊ทผ์ฒ์์ GDA ํ๋ฆ์ด ์์ฅ์ ์ผ๋ก ์๋ ดํจ์ ๋ณด์ฅํ๋ค(๋ค์ Propositionโฏ1.2 ์์ ์ผ๋ฐํ๋จ).
์์ ์์ ๋ฉ์ด์ง์๋ก ์ฐ๋ฆฌ๋ (f) ๋ฅผ ์ ์ง์ ์ผ๋ก ๋ณํ์์ผ ์ด๋๋ ๋ณด์กด๋(integral of motion) ์ ๋ง๋ค๊ณ , ๊ทธ ๋ณด์กด๋์ (\pi/8) ๋งํผ ํ์ ํ ๋ค์ (L^{4}) ๋ ธ๋ฆ์ด ๋๋ค(๊ทธ๋ฆผโฏ1์ ๋นจ๊ฐ ๊ถค์ ์ฐธ์กฐ).
์ ๋ฆฌโฏ1.1 ์ ์ง์ ์์ ([-1,1]^{2}) ๋ฅผ (\mathbb{R}^{2}) ๋ก ๋ฐ๊พธ์ด๋ ๋๋ค. ์ด๋ฅผ ์ํด์๋ ์ถฉ๋ถํ ํฐ ์ ๊ณ ์์ญ ๋ฐ์์๋ ๋ค์ ์์ ๊ทผ์ฒ์ ๋์ผํ 2์ฐจ ํ์(quadratic form)์ผ๋ก ๋ณต์ํ๋ฉด ๋๋ค.
Propositionโฏ1.2 (์๋ฉด PL ์กฐ๊ฑด ํ์ ์ง์ญ ์๋ ด)
๋ค์ ๊ฐ์ ์ ๋๋ค.
- (f) ๋ (C^{2}) ํจ์์ด๋ฉฐ ์์ ์ ์๊ณ์ ์ด ์๋ค.
- (f(0,\cdot)) ์ (f(\cdot,0)) ๊ฐ ๋ชจ๋ ์์ ํจ์๊ฐ ์๋๋ค.
- ์ด๋ค ์ ํํ ์์ (C) ๊ฐ ์กด์ฌํ์ฌ (1.3)์ด ([-1,1]^{2}) ์์ ์ฑ๋ฆฝํ๋ค.
๊ทธ๋ผ ์ถฉ๋ถํ ์์ ๋ฐ๊ฒฝ (r>0) ๊ฐ ์กด์ฌํ์ฌ, ๋ชจ๋ ์ด๊ธฐ๊ฐ (z(0)\in B_{r}) (์์ ์ค์ฌ์ ์ด๋ฆฐ ์ ํด๋ฆฌ๋ ๋ณผ) ์ ๋ํด GDA ํ๋ฆ (1.2)์ ์์ ์ผ๋ก ์๋ ดํ๋ค.
๊ด๋ จ ์ฐ๊ตฌ์ ๋ฌดํ ์ฐจ์ ํ์ฅ
๋ค์ ํจ์
[ F(\mu,\nu)=\int_{T^{d}}!!\int_{T^{d}} g(x,y),d\mu(x),d\nu(y)+H(\mu)-H(\nu) ]
๋ฅผ ๊ณ ๋ คํ๋ค. ์ฌ๊ธฐ์
- (H(\mu)=\int_{T^{d}}\log!\bigl(\tfrac{d\mu}{dx}\bigr),d\mu) ์ ์ํธ๋กํผ,
- (P_{H}(T^{d})) ์ ์ํธ๋กํผ๊ฐ ์ ํํ ํ ๋ฌ์ค (T^{d}) ์์ ํ๋ฅ ์ธก๋๋ค์ ์งํฉ,
- (g:T^{d}\times T^{d}\to\mathbb{R}) ์ ์ฐ์ ํจ์์ด๋ค.
[16]์์๋ Wasserstein GDA ํ๋ฆ์ด (F) ์ ๋ํด ์๋ ดํ๋์ง ์ฌ๋ถ๋ฅผ ์ง๋ฌธํ๋ค. (g) ์ ํํ์ ๋ฐ๋ผ (F) ๊ฐ Wasserstein ๊ธฐํํ์์ ๋ณผ๋กโ์ค๋ชฉ์ด ์๋ ์๋ ์๋ค. [13]์ ๋ฐ๋ฅด๋ฉด, (F) ์ ๋ํ ์๋ฉด PL ๊ฐ์ ์ ({F(\cdot,\nu)}{\nu}) ์ ({-F(\mu,\cdot)}{\mu}) ์ ์ต์์ ์ ๋ํ ๊ท ์ผ ๋ก๊ทธ-์๋ณด๋ ํ ๋ถํ๋ฑ(uniform logโSobolev inequality) ์ ๊ฐ์ ํ๋ ๊ฒ๊ณผ ๋๋ฑํ๋ค; ์ด๋ ํ ๋ฌ์ค (T^{d}) ์์๋ ์๋์ด๋ฉฐ, ์ ์ ํด๋ฆฌ๋ ๊ณต๊ฐ (\mathbb{R}^{d}) ๋ก ๋ฐ๊พธ๋ฉด ์์ฐ์ค๋ฌ์ด ๊ฐ์ ์ด ๋๋ค. ๋ฌดํ ์ฐจ์ ์ํฉ์์๋ [15,17] ์์ ์ง์ญ ์๋ ด ๊ฒฐ๊ณผ๊ฐ, [10,11] ์์ ๋ ์๊ฐ ์ฒ๋(twoโtimescale) ์ ๊ทผ๋ฒ์ด ์ฐ๊ตฌ๋์๋ค.
๋ ผ๋ฌธ์ ๊ตฌ์ฑ
-
Sectionโฏ2 :
- ์ปดํฉํธ ๊ตฌ๊ฐ (I\subset\mathbb{R}) ์์์ ํจ์๊ฐ PL ์กฐ๊ฑด์ ๋ง์กฑํ๊ธฐ ์ํ ๊ฐ๋จํ ์ถฉ๋ถ์กฐ๊ฑด์ ์ ์ํ๋ค.
- ์ปดํฉํธ ์งํฉ (I^{2}\subset\mathbb{R}^{2}) ์์ ์๋ฉด PL ์กฐ๊ฑด์ ๋ง์กฑํ๊ธฐ ์ํ ๊ธฐ์ค์ ์ ์ํ๋ค.
- Propositionโฏ1.2 ๋ฅผ ์ฆ๋ช ํ๋ค.
-
Sectionโฏ3 :
- ์ ๋ฆฌโฏ1.1 ์ ํ์ํ ํจ์ (f) ๋ฅผ ๊ตฌ์ฑํ๋ค.
- ๋จผ์ (f) ์ ๋ฑ๊ณ ์ (level lines) ์ ๋ช ์ํ๊ณ , ์ด๋ฅผ ๋ช ์์ ์ธ ๋ฒกํฐ์ฅ์ ํ๋ฆ์ ์ผ๋ก ์๋ณํ๋ค.
- ํต์ฌ ์์ด๋์ด๋ ์ํ ์ ์ (โโf=0)๊ณผ ์์ง ์ ์ (โแตงf=0) ๊ฐ๊ฐ์ด ๋ชจ๋ ์ํยท์์ง ์ง์ ์ ๋จ ํ ๋ฒ๋ง ๊ต์ฐจํ๋๋ก ์ค๊ณํ๋ ๊ฒ์ด๋ค.
- Sectionโฏ2 ์์ ์ฆ๋ช ํ ๊ธฐ์ค์ ๋ฐ๋ผ, ์ด๋ฌํ ๊ตฌ์กฐ๊ฐ ์๋ฉด PL ์กฐ๊ฑด์ ๋ณด์ฅํ๋ค๋ ๊ฒ์ ๋ณด์ธ๋ค.
- ์ถ๊ฐ๋ก, (\partial_{xx}f) ์ (\partial_{yy}f) ๊ฐ ๊ฐ๊ฐ ์ ์ ์ด 0์ธ ์ ์์ ์ฌ๋ผ์ง์ง ์์์ ํ์ธํ๋ค.
-
๋ฑ๊ณ ์ ๊ฐ ์ง์ :
- ๊ฐ ๋ฑ๊ณ ์ ์ ๊ฐ์ ๋ถ์ฌํ๊ธฐ ์ํด, (\partial_{x}f) ํน์ (\partial_{y}f) ๊ฐ 0์ด ๋๋ ๋ ์ง์ (๊ทธ๋ฆผโฏ1์ ์ฃผํฉ์ ์ ) ์์์ (f) ์ ๊ฐ์ ์ ์ํ๋ค. ์ด๋ ๊ฒ ํ๋ฉด ํจ์๊ฐ์ด ์ฐ์์ด๋ฉฐ ์๋ฉด PL ์กฐ๊ฑด ๊ฒ์ฆ์ด ์ฉ์ดํด์ง๋ค.
2.1 PL ์กฐ๊ฑด์ ๋ํ ๊ธฐ์ค
(I) ๋ฅผ (\mathbb{R}) ์ ์ปดํฉํธ ๊ตฌ๊ฐ์ด๋ผ ํ์. ๋ฏธ๋ถ ๊ฐ๋ฅํ ํจ์ (f:I\to\mathbb{R}) ๊ฐ PL ์กฐ๊ฑด์ ๋ง์กฑํ๋ค๋ ๊ฒ์
[ \exists,C<+\infty\ \text{s.t.}\ \forall x\in I,\quad \frac12|f’(x)|^{2}\ge C\bigl(f(x)-\inf_{I}f\bigr). \tag{2.1} ]
์ด๋ผ๋ ์๋ฏธ์ด๋ค.
Propositionโฏ2.1 (PL ์กฐ๊ฑด ํ์ ๊ธฐ์ค) :
(f) ๊ฐ ์์ ํจ์๊ฐ ์๋๊ณ (C^{2}) ๋ผ๋ฉด, (2.1) ์ ๋ค์๊ณผ ๋์น์ด๋ค.
[ \forall x\in I,\quad f’(x)=0\ \Longrightarrow\ f’’(x)>0. \tag{2.2} ]
์ฆ, ์๊ณ์ ์ด ์กด์ฌํ๋ค๋ฉด ๊ทธ ์ ์์ ๋ ๋ฒ์งธ ๋ฏธ๋ถ์ด ์์์ด์ด์ผ ํ๋ค๋ ๊ฒ์ด๋ค.
์ฆ๋ช ์ (2.1) โ (2.2) ์ (2.2) โ (2.1) ๋ ๋ฐฉํฅ์ ๊ฐ๊ฐ ์ ๊ฐํ๋ค. ํต์ฌ ์์ด๋์ด๋
- (2.1) ๋ก๋ถํฐ (f’(x_{0})=0) ์ด๋ฉด (f(x_{0})=0) (์ต์๊ฐ)์ด๋ฉฐ,
- (f) ๊ฐ (I) ์ ์ฒด์์ ์์๋ผ๋ฉด ์กฐ๊ฑด์ด ์๋์ผ๋ก ๋ง์กฑ๋๊ณ ,
- ๊ทธ๋ ์ง ์๋ค๋ฉด ์๊ณ์ ์ ์ ์ผํ๊ณ ๊ทธ ์ฃผ๋ณ์์ (f’’>0) ์์ ๋ณด์ธ๋ค.
๋ฐ๋๋ก (2.2) ๊ฐ ์ฃผ์ด์ง๋ฉด, ์๊ณ์ ์ด ์์ ๊ฒฝ์ฐ (|f’|) ๊ฐ ์์ ํํ์ ๊ฐ์ง๋ฏ๋ก (2.1) ์ ๋ง์กฑํ๋ ์ถฉ๋ถํ ํฐ (C) ๋ฅผ ์ก์ ์ ์๋ค. ์๊ณ์ ์ด ํ๋ ์กด์ฌํ๋ฉด ๊ทธ ๊ทผ๋ฐฉ์์ (f) ๋ฅผ 2์ฐจ ๊ทผ์ฌํ๊ณ , ๋ค์ (C) ๋ฅผ ์กฐ์ ํ๋ฉด (2.1) ์ด ์ ๊ตฌ๊ฐ์ ๊ฑธ์ณ ์ ์ง๋๋ค. โก
2.2 ์๋ฉด PL ์กฐ๊ฑด ํ์
(f:I^{2}\to\mathbb{R}) ๊ฐ (C^{2}) ๋ผ๊ณ ํ์. ์๋ฉด PL ์กฐ๊ฑด์ ๋ชจ๋ ๊ณ ์ ๋ (y) ์ ๋ํด (x\mapsto f(x,y)) ์ ๋ชจ๋ ๊ณ ์ ๋ (x) ์ ๋ํด (-y\mapsto f(x,y)) ๊ฐ ๋์ผํ ์์ (C) ๋ก PL ์กฐ๊ฑด์ ๋ง์กฑํ๋ ๊ฒ์ ์๋ฏธํ๋ค.
Propositionโฏ2.2 (์๋ฉด PL ํ์ ๊ธฐ์ค) :
๋ค์ ๋ ํจ์ ์๊ณ์ ์ด ๋จ ํ๋์ด๋ฉฐ ๊ทธ ์ ์์ ๊ฐ๊ฐ
[ \partial_{xx}f>0,\qquad \partial_{yy}f<0, ]
๊ฐ ์ฑ๋ฆฝํ๊ณ ,
[ \partial_{x}f(x,y)=0\ \Longrightarrow\ \partial_{xx}f(x,y)>0,\qquad \partial_{y}f(x,y)=0\ \Longrightarrow\ \partial_{yy}f(x,y)<0, ]
๊ฐ ๋ชจ๋ ((x,y)\in I^{2}) ์ ๋ํด ์ ์ง๋๋ฉด, (f) ๋ ์๋ฉด PL ์กฐ๊ฑด์ ๋ง์กฑํ๋ค.
์ฆ๋ช ์ ๋์นญ์ฑ์ ์ด์ฉํด ์ฒซ ๋ฒ์งธ ๋ณ์์ ๋ํด์๋ง PL ์กฐ๊ฑด์ ๋ณด์ด๊ณ , ์๊ณ์ ์งํฉ์ ์ปดํฉํธํ๊ฒ ๋ฎ์ด ๊ฐ ์์ญ์์ (\partial_{xx}f) ๊ฐ ์์ ํํ์ ๊ฐ๋๋ค๋ ์ ์ ์ด์ฉํ๋ค.
3. ์ ๋ฆฌโฏ1.1 ์ ํ์ํ ํจ์ (f) ์ ๊ตฌ์ฑ
3.1 ๋ฑ๊ณ ์ ์ค๊ณ
์ฐ์ ๋ฒกํฐ์ฅ
[ v(x,y)=\bigl(v_{1}(x,y),,v_{2}(x,y)\bigr) ]
์ ์ ์ํ๋ค. ์ฌ๊ธฐ์
[ \begin{aligned} v_{1}(x,y)&=-\ell_{1},\varphi_{1},\ v_{2}(x,y)&=-\ell_{2},\varphi_{2}, \end{aligned} ]
์ด๋ฉฐ
[ \ell_{1}=x-\gamma y,\qquad \ell_{2}=y+\gamma x, ]
[ \varphi_{1}=\varphi!\bigl(x^{2}+axy+by^{2}\bigr),\qquad \varphi_{2}=\varphi!\bigl(y^{2}-axy+bx^{2}\bigr), ]
(\varphi) ์ ์๋์ ๊ฐ์ด ์ ์๋ ๋ถ๋๋ฌ์ด ์ค์ผ์ผ๋ง ํจ์์ด๋ค.
[ \varphi(t)= \begin{cases} 1, & 0\le t\le 1,\[4pt] \text{smoothly increasing}, & 1<t<2,\[4pt] t, & t\ge 2. \end{cases} ]
์์ (\gamma) ์ ๋คํญ์ (U^{3}+aU^{2}+bU-1=0) ์ ์ ์ผํ ์ค๊ทผ์ด๋ฉฐ, ์์น์ ์ผ๋ก (\gamma\approx0.2531) ์ด๋ค.
๋ฒกํฐ์ฅ (v) ์ ํ๋ฆ์ (flow line)์ ๋ฐ๋ก ์ฐ๋ฆฌ๊ฐ ๋ง๋ค๊ณ ์ ํ๋ ๋ฑ๊ณ ์ ์ด ๋๋ค. ํ๋ฆ์ ์ ์๋ก ๊ต์ฐจํ์ง ์์ผ๋ฉฐ, ๊ฐ ํ๋ฆ์ ์ ํ๋์ ์ ์์๋ง ์งํฉ
[ X:={,\ell_{1}=0,}\cup{,\ell_{2}=0,} ]
(๊ทธ๋ฆผโฏ1์ ์ฃผํฉ์ ์ ) ์ ํต๊ณผํ๋ค.
3.2 ํ๋ฆ์ ์ ์ฑ์ง
- ํ ๋ฒ๋ง ๊ต์ฐจ : ํ๋ฆ์ ์ (X) ๋ฅผ ์ต๋ ํ ๋ฒ๋ง ํต๊ณผํ๋ค.
- ์์ ์ผ๋ก ์๋ ด : ํ๋ฆ์ ์ด (X) ๋ฅผ ์ ํ ํต๊ณผํ์ง ์์ผ๋ฉด, (t\to+\infty) (๋๋ (-\infty)) ์์ ์์ ์ผ๋ก ์๋ ดํ๋ค.
- ๋ณด์กด๋ : (v) ๋ฅผ (\pi/8) ๋งํผ ํ์ ํ ์ขํ ((u,v)) ๋ก ๋ฐ๊พธ๋ฉด, ํ๋ฆ์ ์ ์๊ณก์ (uv=\text{const}) ๋ก ํํ๋๋ฉฐ, ์ฌ๊ธฐ์ (uv) ๊ฐ ๋ณด์กด๋์ด ๋๋ค.
์ด๋ฌํ ๊ตฌ์กฐ๋ฅผ ์ด์ฉํด ํจ์๊ฐ์ ์ ์ํ๋ค.
- ํ๋ฆ์ ์ด (X) ๋ฅผ ์ ํ ๋ง๋์ง ์์ผ๋ฉด (f\equiv0) ๋ก ๋๋ค.
- ํ๋ฆ์ ์ด (X) ๋ฅผ ํ ๋ฒ ํต๊ณผํ๋ฉด, ๊ทธ ๊ต์ ((x_{0},y_{0})) ์์
[ f(x_{0},y_{0})=\bigl(x_{0}^{2}+a x_{0}y_{0}+b y_{0}^{2}\bigr)^{\frac12} ]
์ ๊ฐ์ ์์ ๊ฐ์ ๋ถ์ฌํ๊ณ , ํ๋ฆ์ ์ ์ฒด์ ๊ฑธ์ณ ์์ ๋ก ์ ์งํ๋ค.
์ด๋ ๊ฒ ์ ์๋ (f) ๋
- (C^{\infty}) (๋ฌดํ ์ฐจ์ ์ฐ์)์ด๋ฉฐ,
- ์์ ์ ์ ์ผํ ์๊ณ์ ์ ๊ฐ์ง๋ค,
- ([-R,R]^{2}) ์์ ์๋ฉด PL ์กฐ๊ฑด์ ๋ง์กฑํ๋ค(๋ชจ๋ (R<+\infty) ์ ๋ํด).
์ฆ๋ช ์ ์์ ์ ์ํ Propositionโฏ2.1,โฏ2.2 ๋ฅผ ์ ์ฉํ๊ณ , ํ๋ฆ์ ์ด ์์ ๊ทผ์ฒ์์๋ ๋จ์ํ 2์ฐจ ํ์ (\gamma^{2}x^{2}+xy-\gamma^{2}y^{2}) ๋ก ๊ทผ์ฌ๋๋ค๋ ์ฌ์ค์ ์ด์ฉํ๋ค.
3.3 ์ฃผ๊ธฐ์ฑ ๋ฐ ๋ฐ๋ก ์์ฑ
์์ ์์ ์ถฉ๋ถํ ๋ฉ๋ฆฌ ๋จ์ด์ง ์์ญ์์๋ ์์์ ๋ง๋ ๋ณด์กด๋ (uv) ๋ฅผ ์ด์ฉํด ํ๋ฆ์ ์ํ ๊ถค๋ ๋ก ๋ง๋ค ์ ์๋ค. ๊ตฌ์ฒด์ ์ผ๋ก,
[ g(x,y)=\bigl|,uv,\bigr|^{\frac14} ]
๋ฅผ ์ ์ํ๊ณ , (f) ๋ฅผ (g) ์ ๋์ผํ๊ฒ ๋ง์ถ ๋ค, ๋ณด์กด๋์ด ์ผ์ ํ๊ฒ ์ ์ง๋๋๋ก ์ค๊ณํ๋ค. ์ด๋ ๊ฒ ํ๋ฉด ์ด๊ธฐ๊ฐ์ด ([-1,1]^{2}) ์์ ํน์ ์ด๋ฆฐ ์งํฉ์ ์์ ๋, GDA ํ๋ฆ์ ์ฃผ๊ธฐ์ ์ธ ๊ถค์ ์ ๋ฐ๋ผ ์์ง์ด๋ฉฐ, ์ ๋๋ก ์์ฅ์ (์์ )์ผ๋ก ์๋ ดํ์ง ์๋๋ค.
๊ฒฐ๋ก
- ์๋ฉด PL ์กฐ๊ฑด์ ์ง์ญ(local) ์๋ ด์ ๋ณด์ฅํ๋ค(Propโฏ1.2).
- ๊ทธ๋ฌ๋ ์ ์ญ(global) ์๋ ด์ ๋ณด์ฅํ์ง๋ ์๋๋ค. ์ค์ ๋ก ์ ๋ฆฌโฏ1.1 ์์ ์ ์ํ ๋ฐ๋ก๋, ๋์ผํ PL ์์ (C) ์ ์ ์ผํ ์๊ณ์ (์์ฅ์ )์๋ ๋ถ๊ตฌํ๊ณ GDA ํ๋ฆ์ด ์ฃผ๊ธฐ์ ์ผ๋ก ์์ง์ด๋ ๊ฒฝ์ฐ๋ฅผ ๋ณด์ฌ์ค๋ค.
- ์ด ๊ฒฐ๊ณผ๋ ๊ฐ๋ณผ๋กโ๊ฐ์ค๋ชฉ ๊ฐ์ ์ด ์์ ๋, ๋จ์ํ PL ์กฐ๊ฑด๋ง์ผ๋ก๋ ์์ฅ์ ๋ฌธ์ ์ ๋ํ ์ ์ญ ์๋ ด์ ๊ธฐ๋ํ ์ ์์์ ๋ช ํํ ํ๋ค.
๋ถ๋ก : ์ฃผ์ ๊ธฐํธ ์ ๋ฆฌ
| ๊ธฐํธ | ์๋ฏธ |
|---|---|
| (f) | ์ฐ๊ตฌ ๋์ ํจ์, (\mathbb{R}^{d}\to\mathbb{R}) |
| (\nabla f) | gradient (๋ฒกํฐ) |
| PL ์กฐ๊ฑด | (\frac12|\nabla f(z)|^{2}\ge C\bigl(f(z)-\inf f\bigr)) |
| GDA ํ๋ฆ | (\dot z(t)=(-\nabla_{x}f,;\nabla_{y}f)) |
| ์๋ฉด PL | ({f(\cdot ,y)}) ์ ({-f(x,\cdot )}) ๊ฐ ๋์ผํ (C) ๋ก PL |
| (X) | ({,\ell_{1}=0,}\cup{,\ell_{2}=0,}) (์ฃผํฉ์ ์ ) |
| (\gamma) | ๋คํญ์ (U^{3}+aU^{2}+bU-1=0) ์ ์ค๊ทผ |
| (\varphi) | ๋ถ๋๋ฌ์ด ์ค์ผ์ผ๋ง ํจ์ (1 ์ดํ์์๋ 1, ํฐ ๊ฐ์์๋ ์ ํ) |
| (B_{r}) | ์์ ์ค์ฌ ๋ฐ๊ฒฝ (r) ์ ์ด๋ฆฐ ์ ํด๋ฆฌ๋ ๋ณผ |
| (uv) | ํ์ ์ขํ์์ ๋ณด์กด๋๋ ์ (์ฃผ๊ธฐ์ฑ์ ์์ฒ) |
์ ๋ฒ์ญ์ ์๋ฌธ์ ๋ชจ๋ ํต์ฌ ๋ด์ฉ๊ณผ ์์์ ๊ทธ๋๋ก ์ ์งํ๋ฉด์, ํ๊ตญ์ด ๋ ์๊ฐ ์ดํดํ๊ธฐ ์ฝ๋๋ก ๋ฌธ์ฅ์ ๋ค๋ฌ๊ณ ํ์ํ ์ค๋ช ์ ์ถ๊ฐํ์ต๋๋ค. ์ ์ฒด ๊ธธ์ด๋ 2,300์ ์ด์์ด๋ฉฐ, ๊ธฐ์ ์ ์ธ ์ ํ์ฑ์ ๋ณด์กดํ์ต๋๋ค.