Interaction Dynamics as a Reward Signal for LLMs
๐ Abstract
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋ค์ค ํด ๋ํ์ ๋ง์ถ๋ ๊ธฐ์กด ๋ฐฉ๋ฒ์ ์ฃผ๋ก ํ ์คํธ ๋ด์ฉ์์ ์ถ์ถํ ๋ณด์ ์ ํธ์ ์์กดํ๋ค. ๊ทธ๋ฌ๋ ์ด๋ฌํ ์ ๊ทผ์ ์ํธ์์ฉ ์์ฒด๊ฐ ์ ๊ณตํ๋ ํ๋ถํ๊ณ ๋ณด์์ ์ธ ์ ํธ๋ฅผ ๊ฐ๊ณผํ๋ค. ๋ณธ ๋ ผ๋ฌธ์ ๋ํ ์๋ฒ ๋ฉ ๊ถค์ ์ ๊ธฐํํ์ ํน์ฑ์์ ๋์ถ๋ ์๋ก์ด ๋ณด์ ์ ํธ์ธ TRACE(Trajectoryโbased Reward for Agent Collaboration Estimation)๋ฅผ ์ ์ํ๋ค. ํต์ฌ ๋ฐ๊ฒฌ์ ๊ตฌ์กฐ์ ์ ํธ๋ง์ผ๋ก ํ์ต๋ ๋ณด์ ๋ชจ๋ธ์ด ์ ์ฒด ์ ์ฌ ํ ์คํธ๋ฅผ ๋ถ์ํ๋ ๊ฐ๋ ฅํ LLM ๋ฒ ์ด์ค๋ผ์ธ๊ณผ ๋น์ทํ ์๋ณ ์ ํ๋(68.20% vs. 70.04%)๋ฅผ ๋ฌ์ฑํ๋ค๋ ์ ์ด๋ค. ํ ์คํธ ๋ถ์๊ณผ ์ํธ์์ฉ ์ญํ์ ๊ฒฐํฉํ ํ์ด๋ธ๋ฆฌ๋ ๋ชจ๋ธ์ ์ต๊ณ ์ฑ๋ฅ(80.17%)์ ๋ณด์ฌ ๋ ์ ํธ๊ฐ ์ํธ ๋ณด์์ ์์ ์ ์ฆํ๋ค. ์ด ์ฐ๊ตฌ๋ ์ธํฐ๋ํฐ๋ธ ํ๊ฒฝ์์ โ๋ฌด์์ ๋งํ๋๊ฐโ๋ณด๋ค โ์ด๋ป๊ฒ ๋งํ๋๊ฐโ๊ฐ ์ฑ๊ณต์ ์์ธกํ๋ ๊ฐ๋ ฅํ ์งํ๊ฐ ๋ ์ ์์์ ์ฆ๋ช ํ๋ฉฐ, ํ๋ผ์ด๋ฒ์๋ฅผ ๋ณดํธํ๋ฉด์ ์์ด์ ํธ๋ฅผ ์ ๋ ฌํ๊ณ ํ์ ํจํด์ ์ง๋จํ๋ ์๋ก์ด ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํ๋ค.
๐ก Deep Analysis
1. ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ๋๊ธฐ
- ๊ธฐ์กด ๋ณด์ ์ค๊ณ์ ํ๊ณ: ํ์ฌ LLM ์ ๋ ฌ์์๋ ์ฃผ๋ก ํ ์คํธ ๋ด์ฉ(์: ์ ๋ต ์ผ์น, ์ธ๊ฐ ํผ๋๋ฐฑ) ๊ธฐ๋ฐ ๋ณด์์ด ์ฌ์ฉ๋๋ค. ์ด๋ ๋ํ์ ํ๋ฆ, ์๋ต ๊ฐ ๊ฑฐ๋ฆฌ, ๋ํ ์ ๋ฐ์ ๊ตฌ์กฐ์ ๋ณํ ๋ฑ์ ๋ฌด์ํ๋ค.
- ํ๋ผ์ด๋ฒ์์ ๋ฐ์ดํฐ ํจ์จ์ฑ: ํ ์คํธ ์์ฒด๋ฅผ ์ ์ฅยท๋ถ์ํ๋ฉด ๊ฐ์ธ์ ๋ณด ์ ์ถ ์ํ์ด ์๋ค. ๋ฐ๋ฉด ์๋ฒ ๋ฉ ๊ถค์ ์ ์๋ณธ ํ ์คํธ๋ฅผ ๋ณต์ํ๊ธฐ ์ด๋ ค์ ํ๋ผ์ด๋ฒ์ ๋ณดํธ์ ์ ๋ฆฌํ๋ค.
2. ํต์ฌ ์์ด๋์ด โ โ๋ํ ๊ธฐํํโ
- ๋ํ ์๋ฒ ๋ฉ ๊ถค์ : ๋ํ๊ฐ ์งํ๋ ์๋ก ๊ฐ ํด์ ํ ์คํธ๋ฅผ ์ฌ์ ํ์ต๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ(์: SentenceโBERT)์ผ๋ก ๋ณํํ๊ณ , ์ฐ์์ ์ธ ์๋ฒ ๋ฉ์ ์๊ณ์ด๋ก ์ฐ๊ฒฐํ๋ค.
- ๊ธฐํํ์ ํน์ฑ:
- ๊ณก๋ฅ (Curvature): ๋ํ ํ๋ฆ์ด ๊ธ๊ฒฉํ ๋ฐ๋๋ ์ง์ ํ์ง.
- ๊ธธ์ด(Length)์ ์๋(Speed): ์ ์ฒด ๋ํ๊ฐ ์ผ๋ง๋ โ๋น ๋ฅด๊ฒโ ์งํ๋๋๊ฐ.
- ์๊ธฐ์ ์ฌ์ฑ(SelfโSimilarity): ์ด์ ๋ฐํ์์ ์ ์ฌ๋ ๋ณ๋ ํจํด.
- TRACE ๋ณด์: ์ ํน์ฑ๋ค์ ์ ๊ทํยท๊ฐ์คํฉํ์ฌ ํ๋์ ์ค์นผ๋ผ ๋ณด์๊ฐ์ ์ฐ์ถํ๋ค.
3. ๋ชจ๋ธ ์ค๊ณ ๋ฐ ํ์ต
- ๋ณด์ ๋ชจ๋ธ: ๊ฐ๋จํ MLP(๋ค์ธต ํผ์ ํธ๋ก )๋ก, ์ ๋ ฅ์ 5~10 ์ฐจ์์ ๊ธฐํํ์ ํผ์ฒ, ์ถ๋ ฅ์ ์๋ณ ์ ํธ ์ ์.
- ํ์ต ๋ฐ์ดํฐ: ๊ธฐ์กด RLHF(RL with Human Feedback) ๋ฐ์ดํฐ์ ์์ ์ธ๊ฐ ์ ํธ ๋ผ๋ฒจ์ ๊ทธ๋๋ก ์ฌ์ฉํ์ง๋ง, ํ ์คํธ๋ ์ ์ธํ๊ณ ๊ธฐํํ์ ํผ์ฒ๋ง ์ ๊ณต.
- ๋น๊ต ๋ฒ ์ด์ค๋ผ์ธ:
- ํ ์คํธโ์ ์ฉ LLM: ์ ์ฒด ๋ํ ์ ์ฌ๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ๋ณด์ ์์ธก.
- ํ์ด๋ธ๋ฆฌ๋: ํ ์คํธ์ ๊ธฐํํ์ ํผ์ฒ๋ฅผ ๋์์ ์ ๋ ฅ.
4. ์คํ ๊ฒฐ๊ณผ
| ๋ชจ๋ธ | ์๋ณ ์ ํ๋ (Pairwise Accuracy) |
|---|---|
| ํ ์คํธโ์ ์ฉ LLM | 70.04โฏ% |
| TRACEโ์ ์ฉ (๊ธฐํํ) | 68.20โฏ% |
| ํ์ด๋ธ๋ฆฌ๋ (ํ ์คํธโฏ+โฏ๊ธฐํํ) | 80.17โฏ% |
- ๋ณด์์ฑ ํ์ธ: ํ์ด๋ธ๋ฆฌ๋ ๋ชจ๋ธ์ด ๋ ์ ํธ๋ฅผ ๊ฒฐํฉํ์ ๋ ํฐ ํญ์ ์ฑ๋ฅ ํฅ์์ ๋ณด์ด๋ฉฐ, ๊ธฐํํ์ ์ ํธ๊ฐ ํ ์คํธ ์ ํธ์ ๋ ๋ฆฝ์ ์ธ ์ ๋ณด๋ฅผ ์ ๊ณตํจ์ ์ ์ฆํ๋ค.
- ํ๋ผ์ด๋ฒ์ ์คํ: ํ ์คํธ๋ฅผ ์์ ํ ๋ง์คํนํ ์ํ์์๋ 68% ์์ค์ ์ ํ๋๋ฅผ ์ ์ง, ๋ฏผ๊ฐ ์ ๋ณด๊ฐ ํฌํจ๋ ๋ํ์์๋ ์์ ํ๊ฒ ํ์ฉ ๊ฐ๋ฅํจ์ ์์ฐ.
5. ์์ ๋ฐ ์ ์ฉ ๊ฐ๋ฅ์ฑ
- ํ๋ผ์ด๋ฒ์โ์ฐ์ ์ ๋ ฌ: ์๋ฃยท๋ฒ๋ฅ ยท๊ธ์ต ๋ฑ ๋ฏผ๊ฐํ ๋๋ฉ์ธ์์ ํ ์คํธ๋ฅผ ์ ์ฅํ์ง ์๊ณ ๋ LLM์ ์ ๋ ฌํ ์ ์๋ค.
- ์ง๋จ ๋๊ตฌ: ๋ํ ๊ถค์ ์ ์๊ฐํํจ์ผ๋ก์จ ํ์ ์คํจ ์์ธ์ โ๋ํ ํ๋ฆ์ ๊ธ๊ฒฉํ ๋ณ๋โ ๋ฑ์ผ๋ก ์ง๊ด์ ์ผ๋ก ํ์ ๊ฐ๋ฅ.
- ๋ค์ค ์์ด์ ํธ ํ์ : ์ธ๊ฐโAI ํน์ AIโAI ํ์ ์, ๊ฐ ์์ด์ ํธ์ ๋ํ ํจํด์ ์ ๋ํํด ์ญํ ๋ถ๋ด์ด๋ ๋ฆฌ๋์ญ ์ ํ์ ์๋์ผ๋ก ๊ฐ์งํ ์ ์๋ค.
6. ํ๊ณ์ ๋ฐ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
- ์๋ฒ ๋ฉ ๋ชจ๋ธ ์์กด์ฑ: ํ์ฌ๋ ๊ณ ์ ๋ ์ฌ์ ํ์ต ์๋ฒ ๋ฉ์ ์ฌ์ฉํ์ผ๋ฉฐ, ์๋ฒ ๋ฉ ํ์ง์ ๋ฐ๋ผ ๊ธฐํํ์ ํผ์ฒ๊ฐ ํฌ๊ฒ ๋ฌ๋ผ์ง ์ ์๋ค. ํฅํ LLM ์์ฒด ์๋ฒ ๋ฉ์ ๋์ ํ์ตํ๋ ๋ฐฉ๋ฒ์ ํ์ํด์ผ ํจ.
- ํผ์ฒ ์ค๊ณ์ ์ฃผ๊ด์ฑ: ๊ณก๋ฅ ยท์๋ยท์๊ธฐ์ ์ฌ์ฑ ๋ฑ ์ ํ๋ ํผ์ฒ๊ฐ ์ต์ ์ธ์ง ๊ฒ์ฆ์ด ํ์ํ๋ฉฐ, ์๋ ํผ์ฒ ํ์ต(์: ๊ทธ๋ํ ์ ๊ฒฝ๋ง)์ผ๋ก ํ์ฅ ๊ฐ๋ฅ์ฑ์ ๊ฒํ ํ๋ค.
- ์ค์ผ์ผ๋ง: ํ์ฌ ์คํ์ 10k~50k ๋ํ ์์ค์ ๊ตญํ๋์์ผ๋ฉฐ, ์๋ฐฑ๋ง ๋ํ์ ๋ํ ํจ์จ์ฑ ๋ฐ ์ผ๋ฐํ ์ฑ๋ฅ์ ํ๊ฐํด์ผ ํ๋ค.
- ๋ค์ธ์ดยท๋ค๋ฌธํ ์ ์ฉ: ์๋ฒ ๋ฉ์ด ์ธ์ด๋ง๋ค ๋ค๋ฅด๊ฒ ๋์ํ ์ ์์ด, ๋ค์ธ์ด ํ๊ฒฝ์์์ ๊ธฐํํ์ ๋ณด์์ ์ผ๊ด์ฑ์ ๊ฒ์ฆํ ํ์๊ฐ ์๋ค.
7. ๊ฒฐ๋ก
TRACE๋ โ๋ฌด์์ ๋งํ๋๊ฐโ๋ณด๋ค โ์ด๋ป๊ฒ ๋งํ๋๊ฐโ์ ์ด์ ์ ๋ง์ถ ์๋ก์ด ๋ณด์ ์ ํธ ์ฒด๊ณ๋ก, ํ ์คํธ ๊ธฐ๋ฐ ๋ณด์๊ณผ ์ํธ ๋ณด์์ ์ธ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค. ํนํ ํ๋ผ์ด๋ฒ์ ๋ณดํธ์ ๋ํ ํจํด ์ง๋จ์ด๋ผ๋ ๋ถ๊ฐ ๊ฐ์น๋ฅผ ์ ๊ณตํจ์ผ๋ก์จ, ์ฐจ์ธ๋ LLM ์ ๋ ฌ ๋ฐ ํ์ ์์คํ ์ ์ค์ํ ์ค๊ณ ์์๊ฐ ๋ ์ ๋ง์ด๋ค.
๐ Full Content
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋ค์ค ํด ๋ํ ์ ๋ ฌ์ ์ํ ์๋ก์ด ์ ๊ทผ๋ฒ
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(Large Language Models, ์ดํ LLM)์ ๋ค์ค ํด ๋ํ ์ํฉ์ ๋ง๊ฒ ์ ๋ ฌ(alignment)์ํค๋ ์ ํต์ ์ธ ๋ฐฉ๋ฒ์ ์ฃผ๋ก ํ ์คํธ ๋ด์ฉ ์์ฒด์์ ์ถ์ถํ ๋ณด์ ์ ํธ(reward signal)์ ์์กดํ๋ค. ์ฆ, ๋ชจ๋ธ์ด ์์ฑํ ๋ฌธ์ฅ์ ์๋ฏธ์ ์ ํ์ฑ, ์ผ๊ด์ฑ, ์ ์ฉ์ฑ ๋ฑ์ ํ๊ฐํ๊ธฐ ์ํด ์ธ๊ฐ ํ๊ฐ์๋ ์๋ํ๋ ํ๊ฐ ์งํ๊ฐ ์ ๊ณตํ๋ ์ ์๋ฅผ ์ฌ์ฉํ๋ค. ์ด๋ฌํ ํ ์คํธโ์ค์ฌ์ ์ธ ์ ๊ทผ์ ๋ํ๊ฐ ์งํ๋๋ ์ญ๋์ ์ธ ์ํธ์์ฉ ๊ณผ์ โ์๋ฅผ ๋ค์ด, ๋ฐํ ๊ฐ์ ์๊ฐ์ ํ๋ฆ, ๋ํ ์ฐธ์ฌ์ ๊ฐ์ ์๋ต ํจํด, ๋ํ๊ฐ ์งํ๋จ์ ๋ฐ๋ผ ๋ํ๋๋ ์๋ฏธ์ ์ด๋โ์ ์ถฉ๋ถํ ํ์ฉํ์ง ๋ชปํ๋ค๋ ํ๊ณ๊ฐ ์๋ค.
๋ณธ ๋ ผ๋ฌธ์์๋ ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ ์ **โ๋ํ ๊ธฐํํ(conversational geometry)โ**์ด๋ผ๋ ์๋ก์ด ๊ฐ๋ ์ ๋์ ํ๋ค. ๋ํ ๊ธฐํํ์ ๋ํ๊ฐ ์งํ๋๋ ๋์ ๊ฐ ๋ฐํ๊ฐ ์๋ฒ ๋ฉ ๊ณต๊ฐ์ ๋งคํ๋ ๋ ํ์ฑ๋๋ **์๋ฒ ๋ฉ ๊ถค์ (trajectory)**์ ๊ธฐํํ์ ํน์ฑ์ ๋ถ์ํ๋ค๋ ์์ด๋์ด์ ๊ธฐ๋ฐํ๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ๋ํ์ ๊ฐ ํด์ ๊ณ ์ฐจ์ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ก ๋ณํํ ๋ค, ์ฐ์์ ์ธ ํด ์ฌ์ด์ ๋ฒกํฐ ์ฐจ์ด, ๊ถค์ ์ ๊ณก๋ฅ (curvature), ๊ถค์ ์ด ํ์ฑํ๋ ๊ตฌ์ญ(area) ๋ฑ ๊ตฌ์กฐ์ ยท๋์ ํน์ฑ์ ์ ๋ํํ๋ค. ์ด๋ฌํ ํน์ฑ๋ค์ ๋ํ๊ฐ ์ผ๋ง๋ ์ํํ๊ฒ ํ๋ฅด๋์ง, ์ฐธ์ฌ์ ๊ฐ์ ํ๋ ฅ์ด ์ผ๋ง๋ ํจ์จ์ ์ธ์ง๋ฅผ ๋ฐ์ํ ์ ์๋ค๊ณ ๊ฐ์ ํ๋ค.
์ด๋ฌํ ๊ฐ์ ์ ์ค์ฆํ๊ธฐ ์ํด ์ ์๋ค์ **TRACE(Trajectoryโbased Reward for Agent Collaboration Estimation)**๋ผ๋ ์๋ก์ด ๋ณด์ ์ ํธ๋ฅผ ์ค๊ณํ์๋ค. TRACE๋ ๋ํ ์๋ฒ ๋ฉ ๊ถค์ ์์ ์ถ์ถํ ์ฌ๋ฌ ๊ธฐํํ์ ์งํ๋ค์ ์ข ํฉํ์ฌ ํ๋์ ์ค์นผ๋ผ ๋ณด์๊ฐ์ ์ฐ์ถํ๋ค. ์๋ฅผ ๋ค์ด, ๊ถค์ ์ด ๊ธ๊ฒฉํ ๋ณํ๊ฑฐ๋ ๋ถ๊ท์นํ ์ง๋์ ๋ณด์ด๋ ๊ฒฝ์ฐ๋ ํ์ ์ด ์ํํ์ง ์์์ ์๋ฏธํ๋ฏ๋ก ๋ฎ์ ๋ณด์์ ๋ถ์ฌํ๊ณ , ๋ฐ๋๋ก ๊ถค์ ์ด ๋ถ๋๋ฝ๊ฒ ์ด์ด์ง๋ฉด์ ์ ์ง์ ์ธ ๋ณํ๋ฅผ ๋ณด์ด๋ฉด ๋์ ๋ณด์์ ๋ถ์ฌํ๋ค. ์ด ๊ณผ์ ์์ ์ฌ์ฉ๋๋ ์ฃผ์ ์ํ์ ๋๊ตฌ๋ ๋ฒกํฐ ์ฐจ์ด(norm of difference), ์ฝ์ฌ์ธ ์ ์ฌ๋(cosine similarity), ๊ถค์ ๊ณก๋ฅ (radius of curvature), ๊ทธ๋ฆฌ๊ณ ๊ถค์ ๊ธธ์ด(total path length) ๋ฑ์ด๋ค.
์คํ ์ค๊ณ ๋ฐ ํ๊ฐ ๋ฐฉ๋ฒ
- ๋ฐ์ดํฐ์
- ๋ค์ค ํด ๋ํ๊ฐ ํฌํจ๋ ๊ณต๊ฐ ๋ฐ์ดํฐ์ (์: MultiWOZ, Dialog bAbI ๋ฑ)์ ์ฌ์ฉํ์ฌ ๊ฐ ๋ํ๋ฅผ ํ ์คํธ์ ์๋ฒ ๋ฉ ๊ถค์ ์ผ๋ก ๋์์ ๊ธฐ๋กํ์๋ค.
- ๋ณด์ ๋ชจ๋ธ ํ์ต
- ๋ ์ข
๋ฅ์ ๋ณด์ ๋ชจ๋ธ์ ๋ณ๋๋ก ํ์ตํ์๋ค.
a) ํ ์คํธโ์ ์ฉ ๋ณด์ ๋ชจ๋ธ: ๊ธฐ์กด ์ฐ๊ตฌ์์ ์ฌ์ฉ๋๋ LLM ๊ธฐ๋ฐ ํ๊ฐ ๋ชจ๋ธ๋ก, ์ ์ฒด ์ ์ฌ(transcript)๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ ์ธ๊ฐ ๋ผ๋ฒจ๋ง ์ ์๋ฅผ ์์ธกํ๋ค.
b) TRACEโ์ ์ฉ ๋ณด์ ๋ชจ๋ธ: ์ค์ง ์๋ฒ ๋ฉ ๊ถค์ ์ ๊ธฐํํ์ ํน์ฑ๋ง์ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉํ์ฌ ๋์ผํ ์ธ๊ฐ ๋ผ๋ฒจ๋ง ์ ์๋ฅผ ์์ธกํ๋๋ก ํ์ตํ์๋ค.
- ๋ ์ข
๋ฅ์ ๋ณด์ ๋ชจ๋ธ์ ๋ณ๋๋ก ํ์ตํ์๋ค.
- ํ์ด๋ธ๋ฆฌ๋ ๋ชจ๋ธ
- ํ ์คํธโ์ ์ฉ ๋ชจ๋ธ๊ณผ TRACEโ์ ์ฉ ๋ชจ๋ธ์ ์ถ๋ ฅ๊ฐ์ ๊ฐ์ค ํ๊ท (weighted average)ํ๊ฑฐ๋ ๋ณ๋์ ๋ฉํโํ์ต(metaโlearning) ๋ ์ด์ด๋ฅผ ํตํด ๊ฒฐํฉํ์ฌ ํ์ด๋ธ๋ฆฌ๋ ๋ณด์ ๋ชจ๋ธ์ ๊ตฌ์ถํ์๋ค.
- ํ๊ฐ ์งํ
- ์๋ณ ์ ํ๋(pairwise accuracy)๋ฅผ ์ฃผ์ ์งํ๋ก ์ฑํํ์๋ค. ์ด๋ ๋ ๋ํ ์ํ ์ค ์ด๋ ์ชฝ์ด ์ธ๊ฐ ๋ผ๋ฒจ๋ง ๊ธฐ์ค์์ ๋ ๋์ ํ์ง์ธ์ง๋ฅผ ์ ํํ ์์ธกํ ๋น์จ์ ์๋ฏธํ๋ค.
์ฃผ์ ๊ฒฐ๊ณผ
| ๋ชจ๋ธ | ์๋ณ ์ ํ๋ |
|---|---|
| ํ ์คํธโ์ ์ฉ LLM ๋ฒ ์ด์ค๋ผ์ธ | 70.04โฏ% |
| TRACEโ์ ์ฉ ๊ตฌ์กฐ์ ๋ณด์ ๋ชจ๋ธ | 68.20โฏ% |
| ํ ์คํธโฏ+โฏTRACE ํ์ด๋ธ๋ฆฌ๋ ๋ชจ๋ธ | 80.17โฏ% |
- ๊ตฌ์กฐ์ ๋ณด์ ๋ชจ๋ธ๋ง ์ฌ์ฉํ์์๋ ๋ถ๊ตฌํ๊ณ , ํ ์คํธโ์ ์ฉ ๋ฒ ์ด์ค๋ผ์ธ๊ณผ ๊ฑฐ์ ๋์ผํ ์์ค(68.20โฏ% vs. 70.04โฏ%)์ ์ฑ๋ฅ์ ๋ฌ์ฑํ์๋ค. ์ด๋ ๋ํ์ ๋์ ยท๊ตฌ์กฐ์ ํน์ฑ๋ง์ผ๋ก๋ ํ์ ์ฑ๊ณต์ ์์ธกํ๋ ๋ฐ ์ถฉ๋ถํ ๊ฐ๋ ฅํ ์ ํธ์์ ๋ณด์ฌ์ค๋ค.
- ํ์ด๋ธ๋ฆฌ๋ ๋ชจ๋ธ์ ๋ ์ ํธ๋ฅผ ๊ฒฐํฉํจ์ผ๋ก์จ ์ฑ๋ฅ์ด ํฌ๊ฒ ํฅ์๋์ด 80.17โฏ%๋ผ๋ ์ต๊ณ ์ ํ๋๋ฅผ ๊ธฐ๋กํ์๋ค. ์ด๋ ํ ์คํธ ๋ด์ฉ๊ณผ ๋ํ ํ๋ฆ(์ญ๋์ฑ)์ด ์ํธ ๋ณด์์ ์ด๋ผ๋ ๊ฐ์ค์ ์ค์ฆ์ ์ผ๋ก ๋ท๋ฐ์นจํ๋ค.
๋ ผ๋ฌธ์ ์์ ๋ฐ ํฅํ ํ์ฉ ๋ฐฉ์
- ํ๋ผ์ด๋ฒ์ ๋ณดํธ
- TRACE๋ ํ ์คํธ ์์ฒด๊ฐ ์๋๋ผ ์๋ฒ ๋ฉ ๊ถค์ ์ ๊ธฐํํ์ ํน์ฑ๋ง์ ์ด์ฉํ๋ค. ๋ฐ๋ผ์ ์๋ณธ ๋ํ ๋ด์ฉ์ด ์ธ๋ถ์ ๋ ธ์ถ๋์ง ์์ผ๋ฉฐ, ๋ฏผ๊ฐํ ์ ๋ณด๋ฅผ ํฌํจํ ๋ํ์์๋ ํ๋ผ์ด๋ฒ์๋ฅผ ์ ์งํ๋ฉด์ ๋ชจ๋ธ ์ ๋ ฌ์ด ๊ฐ๋ฅํ๋ค.
- ์ง๋จ ๋๊ตฌ๋ก์์ ํ์ฉ
- ๋ํ๊ฐ ์งํ๋๋ ๋์ ์ค์๊ฐ์ผ๋ก ๊ถค์ ์ ๋ชจ๋ํฐ๋งํ๋ฉด, ํ์ ์ด ์ ์กฐํด์ง๋ ์์ (์: ๊ถค์ ์ด ๊ธ๊ฒฉํ ๋ณํ๊ฑฐ๋ ๋น์ ์์ ์ธ ์ง๋์ ๋ณด์ด๋ ๊ตฌ๊ฐ)์ ์ฆ์ ๊ฐ์งํ ์ ์๋ค. ์ด๋ ๋ํ ์์คํ ๊ฐ๋ฐ์๊ฐ ๋ฌธ์ ์ํฉ์ ๋น ๋ฅด๊ฒ ํ์ ํ๊ณ , ๋ํ ์ ๋ต์ ์์ ํ๊ฑฐ๋ ์ฌ์ฉ์์๊ฒ ์ ์ ํ ํผ๋๋ฐฑ์ ์ ๊ณตํ๋ ๋ฐ ์ ์ฉํ ์ง๋จ ํด๋ก ํ์ฉ๋ ์ ์๋ค.
- ๋ค์ํ ์ธํฐ๋ํฐ๋ธ ํ๊ฒฝ์ผ๋ก์ ํ์ฅ
- ํ์ฌ ์ฐ๊ตฌ๋ ํ ์คํธ ๊ธฐ๋ฐ ๋ํ์ ์ด์ ์ ๋ง์ถ์์ง๋ง, ๋์ผํ ๊ธฐํํ์ ์ ๊ทผ์ ์์ฑ ๋ํ, ๋ฉํฐ๋ชจ๋ฌ ์ธํฐํ์ด์ค, ์ธ๊ฐโ๋ก๋ด ํ์ ๋ฑ ๋ค์ํ ์ธํฐ๋ํฐ๋ธ ํ๊ฒฝ์๋ ์ ์ฉ ๊ฐ๋ฅํ๋ค. ํนํ, ์๊ฐ์ ํ๋์ด๋ ์ ์ค์ฒ์ ๊ฐ์ ๋น์ธ์ด์ ์ ํธ๋ฅผ ์๋ฒ ๋ฉํ์ฌ ๊ถค์ ์ ํฌํจ์ํค๋ฉด, ๋์ฑ ํ๋ถํ ํ์ ํ๊ฐ๊ฐ ๊ฐ๋ฅํ ๊ฒ์ด๋ค.
- ํ์ต ํจ์จ์ฑ ๋ฐ ๋น์ฉ ์ ๊ฐ
- ํ ์คํธโ์ ์ฉ ๋ณด์ ๋ชจ๋ธ์ ๋๊ท๋ชจ LLM์ ๊ทธ๋๋ก ํ์ฉํด์ผ ํ๋ฏ๋ก ์ฐ์ฐ ๋น์ฉ์ด ๋๋ค. ๋ฐ๋ฉด, TRACE๋ ์๋์ ์ผ๋ก ๊ฐ๋ฒผ์ด ๊ธฐํํ์ ์ฐ์ฐ๋ง์ผ๋ก๋ ์ถฉ๋ถํ ๊ฐ๋ ฅํ ์ ํธ๋ฅผ ์ ๊ณตํ๋ฏ๋ก, ์ฐ์ฐ ๋น์ฉ์ ํฌ๊ฒ ์ ๊ฐํ๋ฉด์๋ ๋์ ์ ๋ ฌ ์ฑ๋ฅ์ ์ ์งํ ์ ์๋ค.
๊ฒฐ๋ก
๋ณธ ์ฐ๊ตฌ๋ **โ๋ํ ๊ธฐํํโ**์ด๋ผ๋ ์๋ก์ด ๊ด์ ์ ์ ์ํจ์ผ๋ก์จ, ๋ํ์ ๋ด์ฉ๋ฟ ์๋๋ผ ๋ํ๊ฐ ์งํ๋๋ ๋ฐฉ์ ์์ฒด๊ฐ ์ฑ๊ณต์ ์ธ ํ์ ์ ์์ธกํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํ๋ค๋ ์ฌ์ค์ ์ ์ฆํ์๋ค. ํ ์คํธ ๊ธฐ๋ฐ ๋ณด์ ์ ํธ์ ๊ตฌ์กฐ์ ยท๋์ ์ ํธ๊ฐ ์๋ก ๋ณด์์ ์ผ๋ก ์์ฉํ๋ค๋ ์คํ ๊ฒฐ๊ณผ๋, ํฅํ ๋ํํ AI ์์คํ ์ ์ค๊ณํ ๋ ๋ ๊ฐ์ง ์ ๋ณด๋ฅผ ๋์์ ํ์ฉํ๋ ๊ฒ์ด ์ต์ ์ ์ฑ๋ฅ์ ๋ฌ์ฑํ ์ ์์์ ์์ฌํ๋ค. ๋ํ, TRACE๋ ์๋ณธ ํ ์คํธ๋ฅผ ํ์๋ก ํ์ง ์๊ธฐ ๋๋ฌธ์ ํ๋ผ์ด๋ฒ์๋ฅผ ๋ณด์ฅํ๋ฉด์๋ ๊ฐ๋ ฅํ ์ ๋ ฌ ๋ฉ์ปค๋์ฆ์ ์ ๊ณตํ๊ณ , ์ค์๊ฐ ์ง๋จ ๋๊ตฌ๋ก์๋ ํ์ฉ ๊ฐ๋ฅํ๋ค๋ ์ ์์ ์ค์ฉ์ ๊ฐ์น๋ฅผ ๊ฐ์ง๋ค. ์์ผ๋ก๋ ๋ณด๋ค ๋ค์ํ ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ์ ์ค์ ์ฌ์ฉ์์์ ์ธํฐ๋์ ์ ํฌํจํ ๋๊ท๋ชจ ํ์ฅ ์คํ์ ํตํด TRACE์ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ๊ฒ์ฆํ๊ณ , ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ํ๋ผ์ด๋ฒ์โ์ฐ์ ์ ๋ ฌ ํ๋ ์์ํฌ๋ฅผ ๊ตฌ์ถํ๋ ๊ฒ์ด ๊ธฐ๋๋๋ค.
์ ๋ฒ์ญ์ ์๋ฌธ์ ์๋ฏธ์ ๊ตฌ์กฐ๋ฅผ ์ถฉ์คํ ์ ์งํ๋ฉด์๋, ์ต์ 2,000์๋ฅผ ์ด๊ณผํ๋๋ก ๋ด์ฉ์ ํ์ฅยท๋ณด๊ฐํ ํ๊ตญ์ด ๋ฒ์ ์ด๋ค.