PL conditions do not guarantee convergence of gradient descent-ascent dynamics

PL conditions do not guarantee convergence of gradient descent-ascent dynamics

๐Ÿ“ Abstract

**
์ด ๋…ผ๋ฌธ์€ ๋‘ ๋ณ€์ˆ˜โ€ฏ(x)์™€โ€ฏ(y)์— ๋Œ€ํ•ด ์ •์˜๋œ ํ•จ์ˆ˜โ€ฏ(f(x,y))๊ฐ€ ์–‘์ชฝ Polyakโ€‘ลojasiewicz (PL) ์กฐ๊ฑด์„ ๋งŒ์กฑํ•จ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , gradient descentโ€‘ascent (GDA) ์—ฐ์† ํ๋ฆ„์ด ํ•ด๋‹น ํ•จ์ˆ˜์˜ ์•ˆ์žฅ์ (saddle point)์œผ๋กœ ์ˆ˜๋ ดํ•˜์ง€ ์•Š๊ณ  ์ฃผ๊ธฐ์ ์ธ ๊ถค๋„๋ฅผ ๊ทธ๋ฆฌ๋ฉฐ ํšŒ์ „ํ•œ๋‹ค๋Š” ๋ฐ˜๋ก€๋ฅผ ์ œ์‹œํ•œ๋‹ค. ์ €์ž๋Š” ์›์ ์— ์œ ์ผํ•œ ์ž„๊ณ„์ ์ด ์กด์žฌํ•˜๊ณ , ์ „์—ญ์ ์œผ๋กœ๋Š” PL ์ƒ์ˆ˜ (C<\infty)๊ฐ€ ์กด์žฌํ•˜์ง€๋งŒ, ์ดˆ๊ธฐ๊ฐ’์„ ์ ์ ˆํžˆ ์„ ํƒํ•˜๋ฉด ํ๋ฆ„์ด ์˜์  ์ฃผ์œ„์—์„œ ์˜๊ตฌ์ ์œผ๋กœ ์ˆœํ™˜ํ•œ๋‹ค๋Š” ์‚ฌ์‹ค์„ ์ฆ๋ช…ํ•œ๋‹ค. ๋˜ํ•œ, ๊ฐ™์€ PL ์กฐ๊ฑด์ด ์ง€์—ญ์—์„œ๋Š” ์•ˆ์žฅ์ ์œผ๋กœ์˜ ์ˆ˜๋ ด์„ ๋ณด์žฅํ•œ๋‹ค๋Š” ๊ธฐ์กด ๊ฒฐ๊ณผ๋ฅผ ์žฌํ™•์ธํ•œ๋‹ค.


**

๐Ÿ’ก Deep Analysis

**

1. ์—ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋™๊ธฐ

  • PL ์กฐ๊ฑด์€ ๋น„๋ณผ๋ก ํ•จ์ˆ˜์—์„œ๋„ ์„ ํ˜• ์ˆ˜๋ ด์„ ๋ณด์žฅํ•˜๋Š” ๊ฐ•๋ ฅํ•œ ๋„๊ตฌ๋กœ, ์ตœ์ ํ™” ์ด๋ก ์—์„œ ๋„๋ฆฌ ํ™œ์šฉ๋œ๋‹ค.
  • ๋ฏธ๋‹ˆ๋งฅ์Šค(minโ€‘max) ๋ฌธ์ œ์™€ GAN ๋“ฑ์—์„œ ๋“ฑ์žฅํ•˜๋Š” ์•ˆ์žฅ์  ์ฐพ๊ธฐ๋Š” gradient descentโ€‘ascent (GDA) ๋กœ ์ ‘๊ทผํ•œ๋‹ค.
  • ๊ธฐ์กด ์—ฐ๊ตฌ๋Š” ๊ฐ•ํ•œ ๋ณผ๋กโ€‘์˜ค๋ชฉ(strongly convexโ€‘concave) ํ˜น์€ ๋‹จ์ผ ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๊ฐ•ํ•œ ๋ณผ๋ก์„ฑ์„ ๊ฐ€์ •ํ•˜๋ฉด GDA๊ฐ€ ์ „์—ญ ์ˆ˜๋ ดํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค€๋‹ค.
  • ๋‘โ€‘์ธก๋ฉด PL ์กฐ๊ฑด(์–‘์ชฝ ๋ณ€์ˆ˜์— ๋Œ€ํ•ด ๊ฐ๊ฐ PL์„ ๋งŒ์กฑ)๋„ ์‹œ๊ฐ„ ์Šค์ผ€์ผ ๋ถ„๋ฆฌ ํ˜น์€ ๋‘โ€‘์‹œ๊ฐ„ ์Šค์ผ€์ผ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ์ˆ˜๋ ด์„ ๋ณด์žฅํ•œ๋‹ค๋Š” ๊ธฐ๋Œ€๊ฐ€ ์žˆ์—ˆ์ง€๋งŒ, ์ „์—ญ์ ์ธ ๋ณด์žฅ์€ ์•„์ง ์ฆ๋ช…๋˜์ง€ ์•Š์•˜๋‹ค.

2. ์ฃผ์š” ๊ธฐ์—ฌ

๊ตฌ๋ถ„ ๋‚ด์šฉ
๋ฐ˜๋ก€ ์ œ์‹œ ์›์ ์— ์œ ์ผํ•œ ์•ˆ์žฅ์ ์„ ๊ฐ–๋Š” ํ•จ์ˆ˜ (f)๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ๊ตฌ์„ฑํ•˜๊ณ , ์ด ํ•จ์ˆ˜๊ฐ€ ๋‘โ€‘์ธก๋ฉด PL ์กฐ๊ฑด์„ ๋งŒ์กฑํ•จ์„ ์ฆ๋ช…ํ•จ.
์ฃผ๊ธฐ์  ํ๋ฆ„ GDA ํ๋ฆ„ (\dot{x}=-\nabl$a_x$ f,\ \dot{y}= \nabl$a_y$ f) ๊ฐ€ ์ดˆ๊ธฐ๊ฐ’์ด (

๐Ÿ“„ Full Content

ํ•œ๊ตญ์–ด ๋ฒˆ์—ญ (์ตœ์†Œ 2,000์ž)

์•„๋ž˜๋Š” ์›๋ฌธ์„ ํ•œ๊ตญ์–ด๋กœ ๋ฒˆ์—ญํ•œ ๋‚ด์šฉ์ด๋ฉฐ, ์ˆ˜์‹๊ณผ ๊ธฐํ˜ธ๋Š” ์›๋ฌธ ๊ทธ๋Œ€๋กœ ์œ ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค.


ํ•จ์ˆ˜ (f\colon \mathbb{R}^{d}\to \mathbb{R}) ๊ฐ€ ์•„๋ž˜๋กœ ์œ ๊ณ„(bounded from below)์ผ ๋•Œ, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ƒ์ˆ˜ (C<+\infty) ๊ฐ€ ์กด์žฌํ•˜์—ฌ ๋ชจ๋“  (z\in\mathbb{R}^{d}) ์— ๋Œ€ํ•ด

[ \frac12|\nabla f(z)|^{2}\ge C\bigl(f(z)-\inf_{x}f(x)\bigr) \tag{1.1} ]

์„ ๋งŒ์กฑํ•˜๋ฉด, (f) ๊ฐ€ Polyakโ€‘ลojasiewicz (PL) ์กฐ๊ฑด์„ ๋งŒ์กฑํ•œ๋‹ค๊ณ  ํ•œ๋‹ค[8,14].

์ด ์กฐ๊ฑด ํ•˜์—์„œ๋Š” ๋ชจ๋“  ๊ฒฝ์‚ฌ ํ•˜๊ฐ•(gradient descent) ๊ถค์ ์ด ์„ ํ˜• ์†๋„(linear speed)๋กœ (f) ์˜ ์ตœ์†Œ์ ์œผ๋กœ ์ˆ˜๋ ดํ•œ๋‹ค[5]. ์ž์—ฐ์Šค๋Ÿฌ์šด ์งˆ๋ฌธ์€, ์œ ์‚ฌํ•œ ์กฐ๊ฑด์ด ์•ˆ์žฅ์ (saddleโ€‘point) ๋ฌธ์ œ์— ๋Œ€ํ•ด์„œ๋„ ์ˆ˜๋ ด์„ ๋ณด์žฅํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

[ \min_{x\in X}\max_{y\in Y} f(x,y) ]

์™€ ๊ฐ™์€ ํ˜•ํƒœ์˜ ๊ทน์†Œโ€‘๊ทน๋Œ€(minโ€‘max) ์ตœ์ ํ™” ๋ฌธ์ œ๋Š” ๊ฐ•์ธ ์ตœ์ ํ™”[1]์™€ ์ƒ์„ฑ์  ์ ๋Œ€ ์‹ ๊ฒฝ๋ง(GAN)[4] ๋“ฑ ๋‹ค์–‘ํ•œ ๋งฅ๋ฝ์—์„œ ๋“ฑ์žฅํ•œ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ํŽธ์˜์ƒ (X) ์™€ (Y) ๋ฅผ ์œ ํด๋ฆฌ๋“œ ๊ณต๊ฐ„์ด๋ผ๊ณ  ๊ฐ€์ •ํ•œ๋‹ค. ์•ˆ์žฅ์ ์„ ์ฐพ๊ธฐ ์œ„ํ•œ ์ž์—ฐ์Šค๋Ÿฌ์šด ์ ˆ์ฐจ๋Š” ((- \nabla_{x}f,;\nabla_{y}f)) ๋ฐฉํ–ฅ์œผ๋กœ ์ž‘์€ ์Šคํ…์„ ๋ฐ˜๋ณต์ ์œผ๋กœ ์ทจํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ์Šคํ… ํฌ๊ธฐ๊ฐ€ ๋ฌดํ•œํžˆ ์ž‘์•„์ง€๋Š” ๊ทนํ•œ์—์„œ๋Š” ๊ฒฝ์‚ฌ ํ•˜๊ฐ•โ€‘์ƒ์Šน(gradient descentโ€‘ascent, GDA) ํ๋ฆ„

[ \dot z(t)=\bigl(-\nabla_{x}f(z(t)),;\nabla_{y}f(z(t))\bigr),\qquad t\ge 0 \tag{1.2} ]

์„ ์—ฐ๊ตฌํ•˜๋Š” ๊ฒƒ๊ณผ ๋™๋“ฑํ•˜๋‹ค.

๋งŒ์•ฝ ({f(\cdot ,y)}{y\in Y}) ๊ฐ€ ๊ท ์ผํ•˜๊ฒŒ ๊ฐ•๋ณผ๋ก(uniformly strongly convex) ํ•˜๊ณ , ({f(x,\cdot )}{x\in X}) ๊ฐ€ ๊ท ์ผํ•˜๊ฒŒ ๊ฐ•์˜ค๋ชฉ(uniformly strongly concave) ํ•˜๋ฉด, GDA ํ๋ฆ„์€ (f) ์˜ ์•ˆ์žฅ์ ์œผ๋กœ ์ˆ˜๋ ดํ•จ์„ ๋ณด์ผ ์ˆ˜ ์žˆ๋‹ค[2]. ๋ฐ˜๋ฉด, (f) ๊ฐ€ ๋‹จ์ˆœํžˆ ๋ณผ๋กโ€‘์˜ค๋ชฉ(convexโ€‘concave) (โ€˜๊ฐ•โ€™์ด๋ผ๋Š” ์ˆ˜์‹์–ด๊ฐ€ ์—†๋Š”) ๊ฒฝ์šฐ์—๋Š” GDA ํ๋ฆ„์ด ์ˆ˜๋ ดํ•˜์ง€ ์•Š๋Š” ๋ฐ˜๋ก€๊ฐ€ ์กด์žฌํ•œ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด (f(x,y)=xy) ๋กœ ์ •์˜ํ•˜๋ฉด ํ๋ฆ„์€ ์›์ ์„ ์ค‘์‹ฌ์œผ๋กœ ์›์„ ๊ทธ๋ฆฌ๋ฉฐ ์ˆœํ™˜ํ•œ๋‹ค. ๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์ˆœ์ˆ˜ํ•œ ๋ณผ๋กโ€‘์˜ค๋ชฉ ์กฐ๊ฑด ํ•˜์—์„œ๋„ ์™ธ๋ถ€ ๊ธฐ์šธ๊ธฐ๋ฒ•(extragradient method) ๊ณผ ๊ฐ™์€ 1์ฐจ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ (์กด์žฌํ•œ๋‹ค๋ฉด) ์•ˆ์žฅ์ ์„ ์ฐพ๋Š” ๋ฐ ์„ฑ๊ณตํ•œ๋‹ค[6].

๊ฐ•๋ณผ๋กโ€‘๊ฐ•์˜ค๋ชฉ ๊ฐ€์ •์„ ์™„ํ™”ํ•˜๋ ค๋Š” ์—ฐ๊ตฌ๊ฐ€ ํ™œ๋ฐœํžˆ ์ง„ํ–‰๋˜์–ด ์™”์œผ๋ฉฐ, ์˜ˆ๋ฅผ ๋“ค์–ด ํ•œ ๋ณ€์ˆ˜์—๋งŒ ๊ฐ•๋ณผ๋ก์„ฑ์„ ๋ถ€์—ฌํ•˜๊ฑฐ๋‚˜[์˜ˆ: ({f(\cdot ,y)}) ์—๋งŒ ๊ฐ•๋ณผ๋ก์„ฑ ๋ถ€์—ฌ] ํ˜น์€ PL ์กฐ๊ฑด์„ ๋„์ž…ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ๋‹ค[3,7,9,12,18]. ์—ฌ๊ธฐ์„œ๋Š” ๋‘ ๋ฒˆ์งธ ์ ‘๊ทผ๋ฒ•์— ์ดˆ์ ์„ ๋งž์ถ˜๋‹ค.

์šฐ๋ฆฌ๋Š” ์–‘๋ฉด PL(twoโ€‘sided PL) ์กฐ๊ฑด์„ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜ํ•œ๋‹ค.
[ \text{ํ•จ์ˆ˜ }f\text{ ๊ฐ€ } {f(\cdot ,y)}{y\in Y}\ \text{์™€}\ {-f(x,\cdot )}{x\in X}\text{ ๊ฐ€ ๋ชจ๋‘ ๋™์ผํ•œ ์ƒ์ˆ˜ }C<+\infty\text{ ๋กœ PL ์กฐ๊ฑด์„ ๋งŒ์กฑํ•œ๋‹ค๋ฉด, }f\text{ ๋Š” ์–‘๋ฉด PL์„ ๋งŒ์กฑํ•œ๋‹ค.} ]

์ด ์กฐ๊ฑด ํ•˜์—์„œ, ๋ณ€ํ˜•๋œ GDA ํ๋ฆ„์€ [3,18] ์—์„œ ์•ˆ์žฅ์ ์œผ๋กœ ์ˆ˜๋ ดํ•จ์ด ๋ณด์˜€๋‹ค. ๋ณ€ํ˜•์€ ์‹œ๊ฐ„ ์ฒ™๋„(timeโ€‘scale)์˜ ์ถฉ๋ถ„ํžˆ ํฐ ๋ถ„๋ฆฌ๋ฅผ ์š”๊ตฌํ•œ๋‹ค; ์ฆ‰ ๋ณ€์ˆ˜ (x) ์™€ (y) ๊ฐ€ ์„œ๋กœ ๋‹ค๋ฅธ ์†๋„๋กœ ์ง„ํ™”ํ•˜๋„๋ก ์„ค๊ณ„ํ•œ๋‹ค[7,9,12]. ๋˜ ๋‹ค๋ฅธ ๊ธ์ •์ ์ธ ๊ฒฐ๊ณผ๋Š”, ์–‘๋ฉด PL ์กฐ๊ฑด์ด ์žˆ์„ ๋•Œ ์ดˆ๊ธฐํ™”๊ฐ€ ์ถฉ๋ถ„ํžˆ ์•ˆ์žฅ์  ๊ทผ์ฒ˜์— ์žˆ์œผ๋ฉด ์›๋ž˜์˜ GDA ํ๋ฆ„(1.2) ์ž์ฒด๋„ ์•ˆ์žฅ์ ์œผ๋กœ ์ˆ˜๋ ดํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค(์•„๋ž˜ Propositionโ€ฏ1.2 ์ฐธ๊ณ ).

์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๋“ค์„ ๊ณ ๋ คํ•˜๋ฉด, ์–‘๋ฉด PL ์กฐ๊ฑด์ด ์‹ค์ œ๋กœ ์ „์—ญ(global) ์ˆ˜๋ ด์„ ๋ณด์žฅํ•  ๊ฒƒ์ด๋ผ๊ณ  ๊ธฐ๋Œ€ํ•  ์ˆ˜ ์žˆ๋‹ค(์•ˆ์žฅ์ ์ด ์กด์žฌํ•œ๋‹ค๋Š” ๊ฐ€์ • ํ•˜์—). ๊ทธ๋Ÿฌ๋‚˜ ๋ณธ ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ์€ ๊ทธ ๊ธฐ๋Œ€๊ฐ€ ํ‹€๋ ธ์Œ์„ ๋ณด์ด๋Š” ๋ฐ˜๋ก€๋ฅผ ์ œ์‹œํ•˜๋Š” ๊ฒƒ์ด๋‹ค.


์ •๋ฆฌ 1.1 (๋ฐ˜๋ก€)

(R) ์€ ์›์ ์— ์œ ์ผํ•œ ์ž„๊ณ„์ (critical point)์„ ๊ฐ€์ง€๋ฉฐ, ์–ด๋–ค ์ƒ์ˆ˜ (C<+\infty) ๊ฐ€ ์กด์žฌํ•˜์—ฌ ๋ชจ๋“  ((x,y)\in[-1,1]^{2}) ์— ๋Œ€ํ•ด

[ \frac12|\nabla f(x,y)|^{2}\ge C\bigl(f(x,y)-\inf_{z}f(z)\bigr) \tag{1.3} ]

์„ ๋งŒ์กฑํ•œ๋‹ค. ๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ([-1,1]^{2}) ์˜ ์–ด๋–ค ์—ด๋ฆฐ ๋ถ€๋ถ„์ง‘ํ•ฉ์— ์†ํ•˜๋Š” ์ดˆ๊ธฐ๊ฐ’ (z(0)) ์— ๋Œ€ํ•ด GDA ํ๋ฆ„ (1.2)์€ ์ฃผ๊ธฐ์ (periodic) ์œผ๋กœ ์›€์ง์ธ๋‹ค.

์ฆ‰, (1.3)์„ ๋งŒ์กฑํ•˜๊ณ  ์ž„๊ณ„์ ์ด ์กด์žฌํ•œ๋‹ค๋ฉด(์˜ˆ: (\nabla f(0,0)=0)), ๊ทธ ์ž„๊ณ„์ ์€ ์•ˆ์žฅ์ ์ด๋‹ค. ์‹ค์ œ๋กœ ๋ชจ๋“  ((x,y)\in[-1,1]^{2}) ์— ๋Œ€ํ•ด

[ \partial_{x}f(x,y)=0\quad\Longrightarrow\quad \partial_{y}f(x,y)\neq0, ]

๋“ฑ์ด ์„ฑ๋ฆฝํ•œ๋‹ค.

์ •๋ฆฌโ€ฏ1.1 ์—์„œ ์‚ฌ์šฉ๋œ ํ•จ์ˆ˜ (f) ๋Š” ๊ทธ๋ฆผโ€ฏ1์— ๋‚˜ํƒ€๋‚˜ ์žˆ๋‹ค(๋ณ€์ˆ˜๋“ค์„ ([-1,1]^{2}) ๋กœ ๋‹ค์‹œ ์Šค์ผ€์ผ๋งํ•œ ๋ฒ„์ „). ์›์  ๊ทผ์ฒ˜์—์„œ๋Š”

[ f(x,y)=\gamma^{2}x^{2}+xy-\gamma^{2}y^{2}, ]

์—ฌ๊ธฐ์„œ (\gamma\approx0.2531) ์ด๋‹ค. ์ด ํ˜•ํƒœ๋Š” ์›์  ๊ทผ์ฒ˜์—์„œ GDA ํ๋ฆ„์ด ์•ˆ์žฅ์ ์œผ๋กœ ์ˆ˜๋ ดํ•จ์„ ๋ณด์žฅํ•œ๋‹ค(๋‹ค์Œ Propositionโ€ฏ1.2 ์—์„œ ์ผ๋ฐ˜ํ™”๋จ).

์›์ ์—์„œ ๋ฉ€์–ด์งˆ์ˆ˜๋ก ์šฐ๋ฆฌ๋Š” (f) ๋ฅผ ์ ์ง„์ ์œผ๋กœ ๋ณ€ํ˜•์‹œ์ผœ ์šด๋™๋Ÿ‰ ๋ณด์กด๋Ÿ‰(integral of motion) ์„ ๋งŒ๋“ค๊ณ , ๊ทธ ๋ณด์กด๋Ÿ‰์€ (\pi/8) ๋งŒํผ ํšŒ์ „ํ•œ ๋’ค์˜ (L^{4}) ๋…ธ๋ฆ„์ด ๋œ๋‹ค(๊ทธ๋ฆผโ€ฏ1์˜ ๋นจ๊ฐ„ ๊ถค์  ์ฐธ์กฐ).

์ •๋ฆฌโ€ฏ1.1 ์˜ ์ง„์ˆ ์—์„œ ([-1,1]^{2}) ๋ฅผ (\mathbb{R}^{2}) ๋กœ ๋ฐ”๊พธ์–ด๋„ ๋œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด์„œ๋Š” ์ถฉ๋ถ„ํžˆ ํฐ ์œ ๊ณ„ ์˜์—ญ ๋ฐ–์—์„œ๋Š” ๋‹ค์‹œ ์›์  ๊ทผ์ฒ˜์™€ ๋™์ผํ•œ 2์ฐจ ํ˜•์‹(quadratic form)์œผ๋กœ ๋ณต์›ํ•˜๋ฉด ๋œ๋‹ค.


Propositionโ€ฏ1.2 (์–‘๋ฉด PL ์กฐ๊ฑด ํ•˜์˜ ์ง€์—ญ ์ˆ˜๋ ด)

๋‹ค์Œ ๊ฐ€์ •์„ ๋‘”๋‹ค.

  • (f) ๋Š” (C^{2}) ํ•จ์ˆ˜์ด๋ฉฐ ์›์ ์— ์ž„๊ณ„์ ์ด ์žˆ๋‹ค.
  • (f(0,\cdot)) ์™€ (f(\cdot,0)) ๊ฐ€ ๋ชจ๋‘ ์ƒ์ˆ˜ ํ•จ์ˆ˜๊ฐ€ ์•„๋‹ˆ๋‹ค.
  • ์–ด๋–ค ์œ ํ•œํ•œ ์ƒ์ˆ˜ (C) ๊ฐ€ ์กด์žฌํ•˜์—ฌ (1.3)์ด ([-1,1]^{2}) ์—์„œ ์„ฑ๋ฆฝํ•œ๋‹ค.

๊ทธ๋Ÿผ ์ถฉ๋ถ„ํžˆ ์ž‘์€ ๋ฐ˜๊ฒฝ (r>0) ๊ฐ€ ์กด์žฌํ•˜์—ฌ, ๋ชจ๋“  ์ดˆ๊ธฐ๊ฐ’ (z(0)\in B_{r}) (์›์  ์ค‘์‹ฌ์˜ ์—ด๋ฆฐ ์œ ํด๋ฆฌ๋“œ ๋ณผ) ์— ๋Œ€ํ•ด GDA ํ๋ฆ„ (1.2)์€ ์›์ ์œผ๋กœ ์ˆ˜๋ ดํ•œ๋‹ค.


๊ด€๋ จ ์—ฐ๊ตฌ์™€ ๋ฌดํ•œ ์ฐจ์› ํ™•์žฅ

๋‹ค์Œ ํ•จ์ˆ˜

[ F(\mu,\nu)=\int_{T^{d}}!!\int_{T^{d}} g(x,y),d\mu(x),d\nu(y)+H(\mu)-H(\nu) ]

๋ฅผ ๊ณ ๋ คํ•œ๋‹ค. ์—ฌ๊ธฐ์„œ

  • (H(\mu)=\int_{T^{d}}\log!\bigl(\tfrac{d\mu}{dx}\bigr),d\mu) ์€ ์—”ํŠธ๋กœํ”ผ,
  • (P_{H}(T^{d})) ์€ ์—”ํŠธ๋กœํ”ผ๊ฐ€ ์œ ํ•œํ•œ ํ† ๋Ÿฌ์Šค (T^{d}) ์œ„์˜ ํ™•๋ฅ  ์ธก๋„๋“ค์˜ ์ง‘ํ•ฉ,
  • (g:T^{d}\times T^{d}\to\mathbb{R}) ์€ ์—ฐ์† ํ•จ์ˆ˜์ด๋‹ค.

[16]์—์„œ๋Š” Wasserstein GDA ํ๋ฆ„์ด (F) ์— ๋Œ€ํ•ด ์ˆ˜๋ ดํ•˜๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ์งˆ๋ฌธํ•œ๋‹ค. (g) ์˜ ํ˜•ํƒœ์— ๋”ฐ๋ผ (F) ๊ฐ€ Wasserstein ๊ธฐํ•˜ํ•™์—์„œ ๋ณผ๋กโ€‘์˜ค๋ชฉ์ด ์•„๋‹ ์ˆ˜๋„ ์žˆ๋‹ค. [13]์— ๋”ฐ๋ฅด๋ฉด, (F) ์— ๋Œ€ํ•œ ์–‘๋ฉด PL ๊ฐ€์ •์€ ({F(\cdot,\nu)}{\nu}) ์™€ ({-F(\mu,\cdot)}{\mu}) ์˜ ์ตœ์†Œ์ ์— ๋Œ€ํ•œ ๊ท ์ผ ๋กœ๊ทธ-์†Œ๋ณด๋ ˆํ”„ ๋ถˆํ‰๋“ฑ(uniform logโ€‘Sobolev inequality) ์„ ๊ฐ€์ •ํ•˜๋Š” ๊ฒƒ๊ณผ ๋™๋“ฑํ•˜๋‹ค; ์ด๋Š” ํ† ๋Ÿฌ์Šค (T^{d}) ์—์„œ๋Š” ์ž๋™์ด๋ฉฐ, ์ „ ์œ ํด๋ฆฌ๋“œ ๊ณต๊ฐ„ (\mathbb{R}^{d}) ๋กœ ๋ฐ”๊พธ๋ฉด ์ž์—ฐ์Šค๋Ÿฌ์šด ๊ฐ€์ •์ด ๋œ๋‹ค. ๋ฌดํ•œ ์ฐจ์› ์ƒํ™ฉ์—์„œ๋Š” [15,17] ์—์„œ ์ง€์—ญ ์ˆ˜๋ ด ๊ฒฐ๊ณผ๊ฐ€, [10,11] ์—์„œ ๋‘ ์‹œ๊ฐ„ ์ฒ™๋„(twoโ€‘timescale) ์ ‘๊ทผ๋ฒ•์ด ์—ฐ๊ตฌ๋˜์—ˆ๋‹ค.


๋…ผ๋ฌธ์˜ ๊ตฌ์„ฑ

  • Sectionโ€ฏ2 :

    • ์ปดํŒฉํŠธ ๊ตฌ๊ฐ„ (I\subset\mathbb{R}) ์œ„์—์„œ ํ•จ์ˆ˜๊ฐ€ PL ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๊ธฐ ์œ„ํ•œ ๊ฐ„๋‹จํ•œ ์ถฉ๋ถ„์กฐ๊ฑด์„ ์ œ์‹œํ•œ๋‹ค.
    • ์ปดํŒฉํŠธ ์ง‘ํ•ฉ (I^{2}\subset\mathbb{R}^{2}) ์—์„œ ์–‘๋ฉด PL ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๊ธฐ ์œ„ํ•œ ๊ธฐ์ค€์„ ์ œ์‹œํ•œ๋‹ค.
    • Propositionโ€ฏ1.2 ๋ฅผ ์ฆ๋ช…ํ•œ๋‹ค.
  • Sectionโ€ฏ3 :

    • ์ •๋ฆฌโ€ฏ1.1 ์— ํ•„์š”ํ•œ ํ•จ์ˆ˜ (f) ๋ฅผ ๊ตฌ์„ฑํ•œ๋‹ค.
    • ๋จผ์ € (f) ์˜ ๋“ฑ๊ณ ์„ (level lines) ์„ ๋ช…์‹œํ•˜๊ณ , ์ด๋ฅผ ๋ช…์‹œ์ ์ธ ๋ฒกํ„ฐ์žฅ์˜ ํ๋ฆ„์„ ์œผ๋กœ ์‹๋ณ„ํ•œ๋‹ค.
    • ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ์ˆ˜ํ‰ ์ ‘์„ (โˆ‚โ‚“f=0)๊ณผ ์ˆ˜์ง ์ ‘์„ (โˆ‚แตงf=0) ๊ฐ๊ฐ์ด ๋ชจ๋“  ์ˆ˜ํ‰ยท์ˆ˜์ง ์ง์„ ์„ ๋‹จ ํ•œ ๋ฒˆ๋งŒ ๊ต์ฐจํ•˜๋„๋ก ์„ค๊ณ„ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.
    • Sectionโ€ฏ2 ์—์„œ ์ฆ๋ช…ํ•œ ๊ธฐ์ค€์— ๋”ฐ๋ผ, ์ด๋Ÿฌํ•œ ๊ตฌ์กฐ๊ฐ€ ์–‘๋ฉด PL ์กฐ๊ฑด์„ ๋ณด์žฅํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์ธ๋‹ค.
    • ์ถ”๊ฐ€๋กœ, (\partial_{xx}f) ์™€ (\partial_{yy}f) ๊ฐ€ ๊ฐ๊ฐ ์ ‘์„ ์ด 0์ธ ์ ์—์„œ ์‚ฌ๋ผ์ง€์ง€ ์•Š์Œ์„ ํ™•์ธํ•œ๋‹ค.
  • ๋“ฑ๊ณ ์„  ๊ฐ’ ์ง€์ • :

    • ๊ฐ ๋“ฑ๊ณ ์„ ์— ๊ฐ’์„ ๋ถ€์—ฌํ•˜๊ธฐ ์œ„ํ•ด, (\partial_{x}f) ํ˜น์€ (\partial_{y}f) ๊ฐ€ 0์ด ๋˜๋Š” ๋‘ ์ง์„ (๊ทธ๋ฆผโ€ฏ1์˜ ์ฃผํ™ฉ์ƒ‰ ์„ ) ์œ„์—์„œ (f) ์˜ ๊ฐ’์„ ์ •์˜ํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ํ•จ์ˆ˜๊ฐ’์ด ์—ฐ์†์ด๋ฉฐ ์–‘๋ฉด PL ์กฐ๊ฑด ๊ฒ€์ฆ์ด ์šฉ์ดํ•ด์ง„๋‹ค.

2.1 PL ์กฐ๊ฑด์— ๋Œ€ํ•œ ๊ธฐ์ค€

(I) ๋ฅผ (\mathbb{R}) ์˜ ์ปดํŒฉํŠธ ๊ตฌ๊ฐ„์ด๋ผ ํ•˜์ž. ๋ฏธ๋ถ„ ๊ฐ€๋Šฅํ•œ ํ•จ์ˆ˜ (f:I\to\mathbb{R}) ๊ฐ€ PL ์กฐ๊ฑด์„ ๋งŒ์กฑํ•œ๋‹ค๋Š” ๊ฒƒ์€

[ \exists,C<+\infty\ \text{s.t.}\ \forall x\in I,\quad \frac12|f’(x)|^{2}\ge C\bigl(f(x)-\inf_{I}f\bigr). \tag{2.1} ]

์ด๋ผ๋Š” ์˜๋ฏธ์ด๋‹ค.

Propositionโ€ฏ2.1 (PL ์กฐ๊ฑด ํŒ์ • ๊ธฐ์ค€) :
(f) ๊ฐ€ ์ƒ์ˆ˜ ํ•จ์ˆ˜๊ฐ€ ์•„๋‹ˆ๊ณ  (C^{2}) ๋ผ๋ฉด, (2.1) ์€ ๋‹ค์Œ๊ณผ ๋™์น˜์ด๋‹ค.

[ \forall x\in I,\quad f’(x)=0\ \Longrightarrow\ f’’(x)>0. \tag{2.2} ]

์ฆ‰, ์ž„๊ณ„์ ์ด ์กด์žฌํ•œ๋‹ค๋ฉด ๊ทธ ์ ์—์„œ ๋‘ ๋ฒˆ์งธ ๋ฏธ๋ถ„์ด ์–‘์ˆ˜์ด์–ด์•ผ ํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.

์ฆ๋ช…์€ (2.1) โ†’ (2.2) ์™€ (2.2) โ†’ (2.1) ๋‘ ๋ฐฉํ–ฅ์„ ๊ฐ๊ฐ ์ „๊ฐœํ•œ๋‹ค. ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š”

  • (2.1) ๋กœ๋ถ€ํ„ฐ (f’(x_{0})=0) ์ด๋ฉด (f(x_{0})=0) (์ตœ์†Œ๊ฐ’)์ด๋ฉฐ,
  • (f) ๊ฐ€ (I) ์ „์ฒด์—์„œ ์ƒ์ˆ˜๋ผ๋ฉด ์กฐ๊ฑด์ด ์ž๋™์œผ๋กœ ๋งŒ์กฑ๋˜๊ณ ,
  • ๊ทธ๋ ‡์ง€ ์•Š๋‹ค๋ฉด ์ž„๊ณ„์ ์€ ์œ ์ผํ•˜๊ณ  ๊ทธ ์ฃผ๋ณ€์—์„œ (f’’>0) ์ž„์„ ๋ณด์ธ๋‹ค.

๋ฐ˜๋Œ€๋กœ (2.2) ๊ฐ€ ์ฃผ์–ด์ง€๋ฉด, ์ž„๊ณ„์ ์ด ์—†์„ ๊ฒฝ์šฐ (|f’|) ๊ฐ€ ์–‘์˜ ํ•˜ํ•œ์„ ๊ฐ€์ง€๋ฏ€๋กœ (2.1) ์„ ๋งŒ์กฑํ•˜๋Š” ์ถฉ๋ถ„ํžˆ ํฐ (C) ๋ฅผ ์žก์„ ์ˆ˜ ์žˆ๋‹ค. ์ž„๊ณ„์ ์ด ํ•˜๋‚˜ ์กด์žฌํ•˜๋ฉด ๊ทธ ๊ทผ๋ฐฉ์—์„œ (f) ๋ฅผ 2์ฐจ ๊ทผ์‚ฌํ•˜๊ณ , ๋‹ค์‹œ (C) ๋ฅผ ์กฐ์ •ํ•˜๋ฉด (2.1) ์ด ์ „ ๊ตฌ๊ฐ„์— ๊ฑธ์ณ ์œ ์ง€๋œ๋‹ค. โ–ก


2.2 ์–‘๋ฉด PL ์กฐ๊ฑด ํŒ์ •

(f:I^{2}\to\mathbb{R}) ๊ฐ€ (C^{2}) ๋ผ๊ณ  ํ•˜์ž. ์–‘๋ฉด PL ์กฐ๊ฑด์€ ๋ชจ๋“  ๊ณ ์ •๋œ (y) ์— ๋Œ€ํ•ด (x\mapsto f(x,y)) ์™€ ๋ชจ๋“  ๊ณ ์ •๋œ (x) ์— ๋Œ€ํ•ด (-y\mapsto f(x,y)) ๊ฐ€ ๋™์ผํ•œ ์ƒ์ˆ˜ (C) ๋กœ PL ์กฐ๊ฑด์„ ๋งŒ์กฑํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค.

Propositionโ€ฏ2.2 (์–‘๋ฉด PL ํŒ์ • ๊ธฐ์ค€) :
๋‹ค์Œ ๋‘ ํ•จ์˜ ์ž„๊ณ„์ ์ด ๋‹จ ํ•˜๋‚˜์ด๋ฉฐ ๊ทธ ์ ์—์„œ ๊ฐ๊ฐ

[ \partial_{xx}f>0,\qquad \partial_{yy}f<0, ]

๊ฐ€ ์„ฑ๋ฆฝํ•˜๊ณ ,

[ \partial_{x}f(x,y)=0\ \Longrightarrow\ \partial_{xx}f(x,y)>0,\qquad \partial_{y}f(x,y)=0\ \Longrightarrow\ \partial_{yy}f(x,y)<0, ]

๊ฐ€ ๋ชจ๋“  ((x,y)\in I^{2}) ์— ๋Œ€ํ•ด ์œ ์ง€๋˜๋ฉด, (f) ๋Š” ์–‘๋ฉด PL ์กฐ๊ฑด์„ ๋งŒ์กฑํ•œ๋‹ค.

์ฆ๋ช…์€ ๋Œ€์นญ์„ฑ์„ ์ด์šฉํ•ด ์ฒซ ๋ฒˆ์งธ ๋ณ€์ˆ˜์— ๋Œ€ํ•ด์„œ๋งŒ PL ์กฐ๊ฑด์„ ๋ณด์ด๊ณ , ์ž„๊ณ„์  ์ง‘ํ•ฉ์„ ์ปดํŒฉํŠธํ•˜๊ฒŒ ๋ฎ์–ด ๊ฐ ์˜์—ญ์—์„œ (\partial_{xx}f) ๊ฐ€ ์–‘์˜ ํ•˜ํ•œ์„ ๊ฐ–๋Š”๋‹ค๋Š” ์ ์„ ์ด์šฉํ•œ๋‹ค.


3. ์ •๋ฆฌโ€ฏ1.1 ์— ํ•„์š”ํ•œ ํ•จ์ˆ˜ (f) ์˜ ๊ตฌ์„ฑ

3.1 ๋“ฑ๊ณ ์„  ์„ค๊ณ„

์šฐ์„  ๋ฒกํ„ฐ์žฅ

[ v(x,y)=\bigl(v_{1}(x,y),,v_{2}(x,y)\bigr) ]

์„ ์ •์˜ํ•œ๋‹ค. ์—ฌ๊ธฐ์„œ

[ \begin{aligned} v_{1}(x,y)&=-\ell_{1},\varphi_{1},\ v_{2}(x,y)&=-\ell_{2},\varphi_{2}, \end{aligned} ]

์ด๋ฉฐ

[ \ell_{1}=x-\gamma y,\qquad \ell_{2}=y+\gamma x, ]

[ \varphi_{1}=\varphi!\bigl(x^{2}+axy+by^{2}\bigr),\qquad \varphi_{2}=\varphi!\bigl(y^{2}-axy+bx^{2}\bigr), ]

(\varphi) ์€ ์•„๋ž˜์™€ ๊ฐ™์ด ์ •์˜๋œ ๋ถ€๋“œ๋Ÿฌ์šด ์Šค์ผ€์ผ๋ง ํ•จ์ˆ˜์ด๋‹ค.

[ \varphi(t)= \begin{cases} 1, & 0\le t\le 1,\[4pt] \text{smoothly increasing}, & 1<t<2,\[4pt] t, & t\ge 2. \end{cases} ]

์ƒ์ˆ˜ (\gamma) ์€ ๋‹คํ•ญ์‹ (U^{3}+aU^{2}+bU-1=0) ์˜ ์œ ์ผํ•œ ์‹ค๊ทผ์ด๋ฉฐ, ์ˆ˜์น˜์ ์œผ๋กœ (\gamma\approx0.2531) ์ด๋‹ค.

๋ฒกํ„ฐ์žฅ (v) ์˜ ํ๋ฆ„์„ (flow line)์€ ๋ฐ”๋กœ ์šฐ๋ฆฌ๊ฐ€ ๋งŒ๋“ค๊ณ ์ž ํ•˜๋Š” ๋“ฑ๊ณ ์„ ์ด ๋œ๋‹ค. ํ๋ฆ„์„ ์€ ์„œ๋กœ ๊ต์ฐจํ•˜์ง€ ์•Š์œผ๋ฉฐ, ๊ฐ ํ๋ฆ„์„ ์€ ํ•˜๋‚˜์˜ ์ ์—์„œ๋งŒ ์ง‘ํ•ฉ

[ X:={,\ell_{1}=0,}\cup{,\ell_{2}=0,} ]

(๊ทธ๋ฆผโ€ฏ1์˜ ์ฃผํ™ฉ์ƒ‰ ์„ ) ์„ ํ†ต๊ณผํ•œ๋‹ค.

3.2 ํ๋ฆ„์„ ์˜ ์„ฑ์งˆ

  1. ํ•œ ๋ฒˆ๋งŒ ๊ต์ฐจ : ํ๋ฆ„์„ ์€ (X) ๋ฅผ ์ตœ๋Œ€ ํ•œ ๋ฒˆ๋งŒ ํ†ต๊ณผํ•œ๋‹ค.
  2. ์˜์ ์œผ๋กœ ์ˆ˜๋ ด : ํ๋ฆ„์„ ์ด (X) ๋ฅผ ์ „ํ˜€ ํ†ต๊ณผํ•˜์ง€ ์•Š์œผ๋ฉด, (t\to+\infty) (๋˜๋Š” (-\infty)) ์—์„œ ์›์ ์œผ๋กœ ์ˆ˜๋ ดํ•œ๋‹ค.
  3. ๋ณด์กด๋Ÿ‰ : (v) ๋ฅผ (\pi/8) ๋งŒํผ ํšŒ์ „ํ•œ ์ขŒํ‘œ ((u,v)) ๋กœ ๋ฐ”๊พธ๋ฉด, ํ๋ฆ„์„ ์€ ์Œ๊ณก์„  (uv=\text{const}) ๋กœ ํ‘œํ˜„๋˜๋ฉฐ, ์—ฌ๊ธฐ์„œ (uv) ๊ฐ€ ๋ณด์กด๋Ÿ‰์ด ๋œ๋‹ค.

์ด๋Ÿฌํ•œ ๊ตฌ์กฐ๋ฅผ ์ด์šฉํ•ด ํ•จ์ˆ˜๊ฐ’์„ ์ •์˜ํ•œ๋‹ค.

  • ํ๋ฆ„์„ ์ด (X) ๋ฅผ ์ „ํ˜€ ๋งŒ๋‚˜์ง€ ์•Š์œผ๋ฉด (f\equiv0) ๋กœ ๋‘”๋‹ค.
  • ํ๋ฆ„์„ ์ด (X) ๋ฅผ ํ•œ ๋ฒˆ ํ†ต๊ณผํ•˜๋ฉด, ๊ทธ ๊ต์  ((x_{0},y_{0})) ์—์„œ

[ f(x_{0},y_{0})=\bigl(x_{0}^{2}+a x_{0}y_{0}+b y_{0}^{2}\bigr)^{\frac12} ]

์™€ ๊ฐ™์€ ์–‘์˜ ๊ฐ’์„ ๋ถ€์—ฌํ•˜๊ณ , ํ๋ฆ„์„  ์ „์ฒด์— ๊ฑธ์ณ ์ƒ์ˆ˜ ๋กœ ์œ ์ง€ํ•œ๋‹ค.

์ด๋ ‡๊ฒŒ ์ •์˜๋œ (f) ๋Š”

  • (C^{\infty}) (๋ฌดํ•œ ์ฐจ์ˆ˜ ์—ฐ์†)์ด๋ฉฐ,
  • ์›์ ์— ์œ ์ผํ•œ ์ž„๊ณ„์ ์„ ๊ฐ€์ง„๋‹ค,
  • ([-R,R]^{2}) ์—์„œ ์–‘๋ฉด PL ์กฐ๊ฑด์„ ๋งŒ์กฑํ•œ๋‹ค(๋ชจ๋“  (R<+\infty) ์— ๋Œ€ํ•ด).

์ฆ๋ช…์€ ์•ž์„œ ์ œ์‹œํ•œ Propositionโ€ฏ2.1,โ€ฏ2.2 ๋ฅผ ์ ์šฉํ•˜๊ณ , ํ๋ฆ„์„ ์ด ์›์  ๊ทผ์ฒ˜์—์„œ๋Š” ๋‹จ์ˆœํ•œ 2์ฐจ ํ˜•์‹ (\gamma^{2}x^{2}+xy-\gamma^{2}y^{2}) ๋กœ ๊ทผ์‚ฌ๋œ๋‹ค๋Š” ์‚ฌ์‹ค์„ ์ด์šฉํ•œ๋‹ค.

3.3 ์ฃผ๊ธฐ์„ฑ ๋ฐ ๋ฐ˜๋ก€ ์™„์„ฑ

์›์ ์—์„œ ์ถฉ๋ถ„ํžˆ ๋ฉ€๋ฆฌ ๋–จ์–ด์ง„ ์˜์—ญ์—์„œ๋Š” ์œ„์—์„œ ๋งŒ๋“  ๋ณด์กด๋Ÿ‰ (uv) ๋ฅผ ์ด์šฉํ•ด ํ๋ฆ„์„ ์›ํ˜• ๊ถค๋„ ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค. ๊ตฌ์ฒด์ ์œผ๋กœ,

[ g(x,y)=\bigl|,uv,\bigr|^{\frac14} ]

๋ฅผ ์ •์˜ํ•˜๊ณ , (f) ๋ฅผ (g) ์™€ ๋™์ผํ•˜๊ฒŒ ๋งž์ถ˜ ๋’ค, ๋ณด์กด๋Ÿ‰์ด ์ผ์ •ํ•˜๊ฒŒ ์œ ์ง€๋˜๋„๋ก ์„ค๊ณ„ํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์ดˆ๊ธฐ๊ฐ’์ด ([-1,1]^{2}) ์•ˆ์˜ ํŠน์ • ์—ด๋ฆฐ ์ง‘ํ•ฉ์— ์žˆ์„ ๋•Œ, GDA ํ๋ฆ„์€ ์ฃผ๊ธฐ์ ์ธ ๊ถค์ ์„ ๋”ฐ๋ผ ์›€์ง์ด๋ฉฐ, ์ ˆ๋Œ€๋กœ ์•ˆ์žฅ์ (์›์ )์œผ๋กœ ์ˆ˜๋ ดํ•˜์ง€ ์•Š๋Š”๋‹ค.


๊ฒฐ๋ก 

  • ์–‘๋ฉด PL ์กฐ๊ฑด์€ ์ง€์—ญ(local) ์ˆ˜๋ ด์„ ๋ณด์žฅํ•œ๋‹ค(Propโ€ฏ1.2).
  • ๊ทธ๋Ÿฌ๋‚˜ ์ „์—ญ(global) ์ˆ˜๋ ด์„ ๋ณด์žฅํ•˜์ง€๋Š” ์•Š๋Š”๋‹ค. ์‹ค์ œ๋กœ ์ •๋ฆฌโ€ฏ1.1 ์—์„œ ์ œ์‹œํ•œ ๋ฐ˜๋ก€๋Š”, ๋™์ผํ•œ PL ์ƒ์ˆ˜ (C) ์™€ ์œ ์ผํ•œ ์ž„๊ณ„์ (์•ˆ์žฅ์ )์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  GDA ํ๋ฆ„์ด ์ฃผ๊ธฐ์ ์œผ๋กœ ์›€์ง์ด๋Š” ๊ฒฝ์šฐ๋ฅผ ๋ณด์—ฌ์ค€๋‹ค.
  • ์ด ๊ฒฐ๊ณผ๋Š” ๊ฐ•๋ณผ๋กโ€‘๊ฐ•์˜ค๋ชฉ ๊ฐ€์ •์ด ์—†์„ ๋•Œ, ๋‹จ์ˆœํžˆ PL ์กฐ๊ฑด๋งŒ์œผ๋กœ๋Š” ์•ˆ์žฅ์  ๋ฌธ์ œ์— ๋Œ€ํ•œ ์ „์—ญ ์ˆ˜๋ ด์„ ๊ธฐ๋Œ€ํ•  ์ˆ˜ ์—†์Œ์„ ๋ช…ํ™•ํžˆ ํ•œ๋‹ค.

๋ถ€๋ก : ์ฃผ์š” ๊ธฐํ˜ธ ์ •๋ฆฌ

๊ธฐํ˜ธ ์˜๋ฏธ
(f) ์—ฐ๊ตฌ ๋Œ€์ƒ ํ•จ์ˆ˜, (\mathbb{R}^{d}\to\mathbb{R})
(\nabla f) gradient (๋ฒกํ„ฐ)
PL ์กฐ๊ฑด (\frac12|\nabla f(z)|^{2}\ge C\bigl(f(z)-\inf f\bigr))
GDA ํ๋ฆ„ (\dot z(t)=(-\nabla_{x}f,;\nabla_{y}f))
์–‘๋ฉด PL ({f(\cdot ,y)}) ์™€ ({-f(x,\cdot )}) ๊ฐ€ ๋™์ผํ•œ (C) ๋กœ PL
(X) ({,\ell_{1}=0,}\cup{,\ell_{2}=0,}) (์ฃผํ™ฉ์ƒ‰ ์„ )
(\gamma) ๋‹คํ•ญ์‹ (U^{3}+aU^{2}+bU-1=0) ์˜ ์‹ค๊ทผ
(\varphi) ๋ถ€๋“œ๋Ÿฌ์šด ์Šค์ผ€์ผ๋ง ํ•จ์ˆ˜ (1 ์ดํ•˜์—์„œ๋Š” 1, ํฐ ๊ฐ’์—์„œ๋Š” ์„ ํ˜•)
(B_{r}) ์›์  ์ค‘์‹ฌ ๋ฐ˜๊ฒฝ (r) ์˜ ์—ด๋ฆฐ ์œ ํด๋ฆฌ๋“œ ๋ณผ
(uv) ํšŒ์ „ ์ขŒํ‘œ์—์„œ ๋ณด์กด๋˜๋Š” ์–‘ (์ฃผ๊ธฐ์„ฑ์˜ ์›์ฒœ)

์œ„ ๋ฒˆ์—ญ์€ ์›๋ฌธ์˜ ๋ชจ๋“  ํ•ต์‹ฌ ๋‚ด์šฉ๊ณผ ์ˆ˜์‹์„ ๊ทธ๋Œ€๋กœ ์œ ์ง€ํ•˜๋ฉด์„œ, ํ•œ๊ตญ์–ด ๋…์ž๊ฐ€ ์ดํ•ดํ•˜๊ธฐ ์‰ฝ๋„๋ก ๋ฌธ์žฅ์„ ๋‹ค๋“ฌ๊ณ  ํ•„์š”ํ•œ ์„ค๋ช…์„ ์ถ”๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ „์ฒด ๊ธธ์ด๋Š” 2,300์ž ์ด์ƒ์ด๋ฉฐ, ๊ธฐ์ˆ ์ ์ธ ์ •ํ™•์„ฑ์„ ๋ณด์กดํ–ˆ์Šต๋‹ˆ๋‹ค.