Detecting Silent Failures in Multi-Agentic AI Trajectories
1. ์ฐ๊ตฌ ๋ฐฐ๊ฒฝ ๋ฐ ํ์์ฑ ๋ฉํฐ์์ด์ ํธ AI ๋ ์ฌ๋ฌ LLM์ด ํ์ ยท๊ฒฝ์ํ๋ฉฐ ๋ณตํฉ์ ์ธ ์์ ์ ์ํํ๋ค. ๋น๊ฒฐ์ ์ฑ ๋๋ฌธ์ ๋์ผ ์ ๋ ฅ์ ๋ํด ์๋ก ๋ค๋ฅธ ๊ถค์ ์ด ์์ฑ๋ ์ ์๋ค. ๊ธฐ์กด LLM ํ๊ฐ ๋ ์ ๋ต ์ผ์น์จ, BLEU, ROUGE ๋ฑ ์ ๋์ ์งํ์ ์์กดํ์ง๋ง, ์นจ๋ฌต ์ค๋ฅ (์: ๋ชฉํ์์ ์ ์ ๋ฉ์ด์ง๋ drift, ๋ฌดํ ๋ฃจํ, ์ค์ํ ์ ๋ณด ๋๋ฝ)๋ ์ด๋ฌํ ์งํ์ ์ ๋๋ฌ๋์ง ์๋๋ค. ์ค๋ฌด์์๋ ์ฌ์ฉ์ ๊ฒฝํ ์ ํ ์ ์์คํ ์ ๋ขฐ์ฑ ์์ค ์ ์ด๋ํ๋ฏ๋ก, ์๋ํ๋ ๋น์ ์ ํ์ง ๋ฉ์ปค๋์ฆ์ด ์ ์คํ ํ์ํ๋ค. 2. ์ฃผ์ ๊ธฐ์ฌ | ๋ฒํธ | ๋ด์ฉ





























