Reward-Guided Discrete Diffusion via Clean-Sample Markov Chain for Molecule and Biological Sequence Design
1. ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋ฌธ์ ์ ์ ์ด์ฐ ํ์ฐ ๋ชจ๋ธ ์ ์์ฐจ์ (autoregressive) ์ ๊ทผ๋ฒ๊ณผ ๋ฌ๋ฆฌ ๋ฐ์ดํฐ์ ๊ณ ์ ๋ ์์๊ฐ ์์ ๋๋ ์์ฐ์ค๋ฝ๊ฒ ์ ์ฉ ๊ฐ๋ฅํ๋ค๋ ์ฅ์ ์ด ์๋ค. ํํยท์๋ฌผ ๋ถ์ผ์์๋ ๋ณด์ ํจ์ (drugโlikeness, enhancer activity ๋ฑ)๊ฐ ๊ทน๋๋ก ๋น์ฐ์ ์ด๋ฉฐ, ์์ ํ ํฐ ๋ณํ์ด ์ ์ฒด ๊ตฌ์กฐ๋ฅผ ๋ฌดํจํํ๊ฑฐ๋ ๋ณด์์ 0์ผ๋ก ๋ง๋ ๋ค. ๊ธฐ์กด์ intermediateโreward ๊ธฐ๋ฐ ๊ฐ์ด๋ (SMC, SVDD, particleโbased ๋ฑ)๋ ๋ ธ์ด์ฆ๊ฐ ์์ธ ์ค๊ฐ ์ํ ์ ๋ํด ๋ณด์์ ๊ณ์ฐํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ
