Provable Sample Complexity Guarantees for Learning of Continuous-Action Graphical Games with Nonparametric Utilities

๐ Abstract
In this paper, we study the problem of learning the exact structure of continuous-action games with non-parametric utility functions. We propose an $\ell_1$ regularized method which encourages sparsity of the coefficients of the Fourier transform of the recovered utilities. Our method works by accessing very few Nash equilibria and their noisy utilities. Under certain technical conditions, our method also recovers the exact structure of these utility functions, and thus, the exact structure of the game. Furthermore, our method only needs a logarithmic number of samples in terms of the number of players and runs in polynomial time. We follow the primal-dual witness framework to provide provable theoretical guarantees.
๐ก Analysis
In this paper, we study the problem of learning the exact structure of continuous-action games with non-parametric utility functions. We propose an $\ell_1$ regularized method which encourages sparsity of the coefficients of the Fourier transform of the recovered utilities. Our method works by accessing very few Nash equilibria and their noisy utilities. Under certain technical conditions, our method also recovers the exact structure of these utility functions, and thus, the exact structure of the game. Furthermore, our method only needs a logarithmic number of samples in terms of the number of players and runs in polynomial time. We follow the primal-dual witness framework to provide provable theoretical guarantees.
๐ Content
๋ฒ์ญ๋ฌธ (2000์ ์ด์)
๋ณธ ๋ ผ๋ฌธ์์๋ ์ฐ์ ํ๋ ๊ฒ์(continuousโaction game) ์ ์ ํํ ๊ตฌ์กฐ๋ฅผ ํ์ตํ๋ ๋ฌธ์ ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ํ๊ตฌํ๋ค. ์ฌ๊ธฐ์ ๋งํ๋ ๊ฒ์์ ํจ์ฉ ํจ์๋ ์ฌ์ ์ ์ธ ํํ๋ฅผ ๊ฐ์ ํ์ง ์๋ ๋น๋ชจ์์ (nonโparametric) ํจ์ฉ ํจ์์ด๋ฉฐ, ์ด๋ฌํ ํจ์๋ค์ ์ฐ์์ ์ธ ํ๋ ๊ณต๊ฐ ์์ ์ ์๋๋ค. ๊ธฐ์กด ์ฐ๊ตฌ๋ค์ ์ฃผ๋ก ํจ์ฉ ํจ์๋ฅผ ํน์ ํ ํ๋ผ๋ฏธํฐ ํํ(์: ์ ํ, ๋คํญ์ ๋ฑ)๋ก ๊ฐ์ ํ๊ณ ์ถ์ ํ์ผ๋, ๋ณธ ์ฐ๊ตฌ๋ ์ด๋ ํ ์ฌ์ ์ ์ธ ํ๋ผ๋ฏธํฐํ๋ ํ์ง ์์ ์ํ์์ ํจ์ฉ ํจ์ ์์ฒด์ ๊ทธ ๊ตฌ์กฐ๋ฅผ ๋ณต์ํ๋ ๊ฒ์ ๋ชฉํ๋ก ํ๋ค.
์ด๋ฅผ ์ํด ์ฐ๋ฆฌ๋ โโ ์ ๊ทํ(โโ regularization) ๋ฅผ ์ ์ฉํ ์๋ก์ด ์ถ์ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. ์ด ๋ฐฉ๋ฒ์ ๋ณต์๋ ํจ์ฉ ํจ์๋ค์ ํธ๋ฆฌ์ ๋ณํ(Fourier transform) ์ ๊ณ์๋ค์ ํฌ์์ฑ(sparsity) ์ ๊ฐ์ ํ๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ํจ์ฉ ํจ์๋ฅผ ํธ๋ฆฌ์ ๊ธ์ ํํ๋ก ์ ๊ฐํ ๋ค, ๊ฐ ์ฃผํ์ ์ฑ๋ถ์ ๋์ํ๋ ๊ณ์ ๋ฒกํฐ์ โโ ํจ๋ํฐ๋ฅผ ๋ถ๊ณผํจ์ผ๋ก์จ ๋ถํ์ํ๊ฑฐ๋ ๊ฑฐ์ ๊ธฐ์ฌํ์ง ์๋ ๊ณ ์ฃผํ ์ฑ๋ถ์ ์์ฐ์ค๋ฝ๊ฒ 0์ผ๋ก ๋ง๋ค๊ณ , ์ค์ ๋ก ์ค์ํ ์ ์ฃผํ ์ฑ๋ถ๋ง์ ๋จ๊ธด๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ๋ณต์๋ ํจ์ฉ ํจ์๋ ์๋ ํจ์์ ๋์ผํ ๊ตฌ์กฐ์ ํน์ฑ์ ์ ์งํ๋ฉด์๋ ์ฐจ์ ์ถ์์ ์ก์ ์ต์ ํจ๊ณผ๋ฅผ ๋์์ ์ป์ ์ ์๋ค.
์ฐ๋ฆฌ์ ์๊ณ ๋ฆฌ์ฆ์ ๊ทนํ ์ ํ๋ ์์ ๋ด์ ๊ท ํ(Nash equilibrium) ์ํ๊ณผ ๊ทธ์ ๋์ํ๋ ๋ ธ์ด์ฆ๊ฐ ์์ธ ํจ์ฉ๊ฐ(noisy utilities) ๋ง์ ์ด์ฉํ๋ค. ์ฆ, ์ ์ฒด ํ๋ ๊ณต๊ฐ์ ์ ๋ถ ํ์ํ๊ฑฐ๋ ๋ชจ๋ ๊ฐ๋ฅํ ๊ท ํ์ ๊ตฌํ ํ์ ์์ด, ๋ช ๊ฐ์ ๊ท ํ ์ํ์ ํด๋น ์ํ์์ ๊ด์ธก๋ ํจ์ฉ๊ฐ(๊ด์ธก ์ค์ฐจ๊ฐ ์กด์ฌํจ)์ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ํ์ต์ ์งํํ๋ค. ์ด๋ ์ฌ์ฉ๋๋ ๊ท ํ ์ํ์ ์๋ ํ๋ ์ด์ด ์์ ๋ํด ๋ก๊ทธarithmic ์์ค์ ๋ถ๊ณผํ๋ฏ๋ก, ๋๊ท๋ชจ ๋ฉํฐ์์ด์ ํธ ์์คํ ์์๋ ์ค์ฉ์ ์ผ๋ก ์ ์ฉ ๊ฐ๋ฅํ๋ค.
ํน์ ํ ๊ธฐ์ ์ ์กฐ๊ฑด(technical conditions)โ์๋ฅผ ๋ค์ด, ํจ์ฉ ํจ์๊ฐ ์ถฉ๋ถํ ๋งค๋๋ฝ๊ณ ํธ๋ฆฌ์ ๊ณ์๋ค์ ์ ๋๊ฐ์ด ๊ธ๊ฒฉํ ๊ฐ์ํ๋ค๋ ๊ฐ์ , ๊ทธ๋ฆฌ๊ณ ๊ด์ธก ๋ ธ์ด์ฆ๊ฐ ์๋ธ๊ฐ์ฐ์์(subโGaussian) ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค๋ ๊ฐ์ โ์ด ๋ง์กฑ๋ ๊ฒฝ์ฐ, ์ ์๋ โโ ์ ๊ทํ ๋ฐฉ๋ฒ์ ํจ์ฉ ํจ์์ ์ ํํ ๊ตฌ์กฐ๋ฅผ ์๋ฒฝํ ๋ณต์ํ๋ค. ํจ์ฉ ํจ์๊ฐ ์ ํํ ๋ณต์๋๋ฉด, ๊ทธ ํจ์๋ค๋ก ์ ์๋๋ ๊ฒ์ ์์ฒด์ ๊ตฌ์กฐ(์ฆ, ๊ฐ ํ๋ ์ด์ด์ ์ ๋ต์ ๋ํ ์ํธ์์ฉ ํํ์ ์์กด ๊ด๊ณ) ์ญ์ ์์ ํ๊ฒ ์ฌ๊ตฌ์ฑ๋ ์ ์๋ค.
๋ํ, ์ฐ๋ฆฌ ๋ฐฉ๋ฒ์ ํ๋ณธ ๋ณต์ก๋(sample complexity) ๊ฐ ํ๋ ์ด์ด ์ (n) ์ ๋ํด (O(\log n)) ๋ก, ์๊ฐ ๋ณต์ก๋(time complexity) ๊ฐ ๋คํญ์(polynomial) ์๊ฐ ์์ ํด๊ฒฐ๋ ์ ์์์ ์ด๋ก ์ ์ผ๋ก ์ฆ๋ช ํ๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ์๊ณ ๋ฆฌ์ฆ์ ์ฃผ์ ์ฐ์ฐ์ ํธ๋ฆฌ์ ๊ณ์ ์ถ์ ๊ณผ โโ ์ ๊ทํ ๋ฌธ์ ์ ์ต์ ํ์ด๋ฉฐ, ์ด๋ ํ๋์ ์ธ ์ ํ ํ๋ก๊ทธ๋๋ฐ ํน์ ์ขํ ํ๊ฐ๋ฒ(coordinate descent) ๊ธฐ๋ฒ์ ์ด์ฉํ๋ฉด ( \text{poly}(n) ) ์๊ฐ ์์ ์ํ๋๋ค.
์ด๋ก ์ ๋ถ์์ ํ๋ผ์ด๋ฉโ๋์ผ ์ฆ์ธ(primalโdual witness) ํ๋ ์์ํฌ ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ ๊ฐ๋๋ค. ํ๋ผ์ด๋ฉโ๋์ผ ์ฆ์ธ ๊ธฐ๋ฒ์ ์ต์ ํ ๋ฌธ์ ์ ์ต์ ํด๊ฐ ํน์ ํ ๊ตฌ์กฐ์ ํน์ฑ์ ๋ง์กฑํ๋ค๋ ๊ฒ์, ํ๋ผ์ด๋ฉ(์๋ฌธ) ๋ณ์์ ๋์ผ(๋ผ๊ทธ๋์ฃผ ์น์) ๋ณ์๋ฅผ ๋์์ ๊ตฌ์ฑํ์ฌ ์ฆ๋ช ํ๋ค. ์ด๋ฅผ ํตํด ์ฐ๋ฆฌ๋ ์ ์๋ โโ ์ ๊ทํ ์ถ์ ๊ธฐ๊ฐ ํฌ์์ฑ ํจํด์ ์ ํํ ๋ณต์ํ๊ณ , ์ค๋ฒํผํ (overfitting) ์ ๋ฐฉ์งํ๋ฉฐ, ๋ ธ์ด์ฆ์ ๊ฐ์ธํ(robust) ํน์ฑ์ ๊ฐ๋๋ค๋ ํ์ ์ ์ธ ์ด๋ก ์ ๋ณด์ฅ(theoretical guarantee) ์ ์ ๊ณตํ๋ค.
์์ฝํ๋ฉด, ๋ณธ ์ฐ๊ตฌ๋ ๋ค์๊ณผ ๊ฐ์ ์ฃผ์ ๊ธฐ์ฌ๋ฅผ ํ๋ค.
- ๋น๋ชจ์์ ํจ์ฉ ํจ์ ๋ฅผ ๋์์ผ๋ก ํ๋ ์ฐ์ ํ๋ ๊ฒ์์ ๊ตฌ์กฐ ํ์ต ๋ฌธ์ ๋ฅผ ์ต์ด๋ก ๊ณต์ํํ๊ณ , ๊ธฐ์กด์ ํ๋ผ๋ฏธํฐํ๋ ์ ๊ทผ๋ฒ๊ณผ ์ฐจ๋ณํ๋ ์๋ก์ด ๋ฌธ์ ์ค์ ์ ์ ์ํ๋ค.
- โโ ์ ๊ทํ์ ํธ๋ฆฌ์ ๋ณํ ์ ๊ฒฐํฉํ ํฌ์์ฑ ์ด์ง ๋ฉ์ปค๋์ฆ์ ์ค๊ณํ์ฌ, ํจ์ฉ ํจ์์ ํต์ฌ ๊ตฌ์กฐ๋ฅผ ์์ค ์์ด ์์ถํ๋ค.
- ๊ทน์์์ ๋ด์ ๊ท ํ ์ํ ๊ณผ ๋ ธ์ด์ฆ๊ฐ ์์ธ ํจ์ฉ๊ฐ ๋ง์ผ๋ก๋ ์ ํํ ๊ตฌ์กฐ ๋ณต์์ด ๊ฐ๋ฅํจ์ ๋ณด์ด๋ฉฐ, ํ๋ณธ ๋ณต์ก๋๊ฐ (O(\log n)) ์์ ์ฆ๋ช ํ๋ค.
- ๋คํญ์ ์๊ฐ ์๊ณ ๋ฆฌ์ฆ ์ ์ ์ํจ์ผ๋ก์จ, ๋๊ท๋ชจ ๋ฉํฐ์์ด์ ํธ ์์คํ ์์๋ ์ค์ฉ์ ์ผ๋ก ์ ์ฉํ ์ ์์์ ์ ์ฆํ๋ค.
- ํ๋ผ์ด๋ฉโ๋์ผ ์ฆ์ธ ํ๋ ์์ํฌ ๋ฅผ ํ์ฉํ ์๊ฒฉํ ์ด๋ก ์ ๋ณด์ฅ ์ ์ ๊ณตํ์ฌ, ์ ์ ๋ฐฉ๋ฒ์ ์ ๋ขฐ์ฑ์ ํ์ ์ ์ผ๋ก ๋ท๋ฐ์นจํ๋ค.
์ด๋ฌํ ๊ฒฐ๊ณผ๋ ๋ณต์กํ ์ฐ์ ํ๋ ๊ฒ์์ ๋ค๋ฃจ๋ ๊ฒฝ์ ํ, ์ ๋ ฅ๋ง ์ด์, ๋ก๋ด ํ๋ ์ ์ด ๋ฑ ๋ค์ํ ๋ถ์ผ์์ ๊ฒ์์ ๋ด์ฌ๋ ๊ตฌ์กฐ๋ฅผ ์ ํํ ํ์ ํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํจ์จ์ ์ธ ์ ๋ต ์ค๊ณ ํน์ ์์คํ ์ต์ ํ ๋ฅผ ์ํํ๋ ๋ฐ ์ค์ํ ์ด๋ก ์ ยท์ค์ฉ์ ํ ๋๋ฅผ ์ ๊ณตํ๋ค. ์์ผ๋ก์ ์ฐ๊ตฌ์์๋ ์ ์๋ ๋ฐฉ๋ฒ์ ์ค์ ๋ฐ์ดํฐ์ ์ ์ฉํด ๋ณด๋ ์ค์ฆ์ ๊ฒ์ฆ, ๊ทธ๋ฆฌ๊ณ ๋ณด๋ค ์ผ๋ฐ์ ์ธ ๋น์ ํ ๋ณํ(์: ์จ์ด๋ธ๋ฆฟ ๋ณํ)๊ณผ์ ๊ฒฐํฉ์ ํตํ ํ์ฅ์ฑ์ ํ์ํ ๊ณํ์ด๋ค.