
Multi GPU Performance of Conjugate Gradient Solver with Staggered Fermions in Mixed Precision
๋ณธ ๋ ผ๋ฌธ์ ๊ณ ์ฑ๋ฅ ์ปดํจํ (HPC) ๋ถ์ผ์์ GPU์ ๊ตฌ์กฐ์ ํน์ฑ์ ๋ฉด๋ฐํ ๋ถ์ํ๊ณ , ์ด๋ฅผ ๊ฒฉ์ ์์์์ญํ(lattice QCD) ๊ณ์ฐ์ ์ ์ฉํ ์ฌ๋ก๋ฅผ ์ ์ํ๋ค. ๋จผ์ , GPU๊ฐ ๋ค์์ ๋จ์ ์ฝ์ด๋ฅผ ํตํด ๋ฐ์ดํฐ ์ฐ์ฐ์ ํนํ๋ ์ค๊ณ๋ฅผ ๊ฐ์ง๊ณ ์๋ค๋ ์ ์ ๊ฐ์กฐํ๋ค. ์ด๋ ์ ํต์ ์ธ CPU๊ฐ ๋ณต์กํ ์ ์ด ํ๋ฆ๊ณผ ์บ์ ๊ด๋ฆฌ์ ๋ฌด๊ฒ๋ฅผ ๋๋ ๋ฐ๋ฉด, GPU๋ ๋์ฉ๋ ์ฐ์ฐ์ ๋์ ๋ณ๋ ฌ์ฑ์ผ๋ก ์ํํ๋๋ก ์ต์ ํ๋ผ ์๋ค. ์ด๋ฌํ ์ฐจ์ด๋ ํนํ ์ฐ์ฐ๋๋ณด๋ค ๋ฉ๋ชจ๋ฆฌ I/O๊ฐ ๋ณ๋ชฉ์ด ๋๋ CG ์๊ณ ๋ฆฌ์ฆ์ ํฐ ์ํฅ์ ๋ฏธ์น๋ค. CG๋ ์ ํ ์์คํ (b A x ) ๋ฅผ