베이즈에이전트: 언어 모델을 위한 베이지안 그래프 모델링
초록
본 논문은 대형 언어 모델(LLM) 에이전트가 베이지안 확률 그래프 모델(PGM)의 원리를 자연어로 시뮬레이션하도록 유도하고, 이를 수치적 베이지안 추론과 결합해 불확실성을 정량화하는 프레임워크 vPGM(Verbalized Probabilistic Graphical Modeling)을 제안한다. 구조 탐색, 언어 기반 사후 추정, 불확실성 하의 예측이라는 세 단계로 구성된 vPGM은 전문가 주도의 모델 설계 없이도 잠재 변수와 의존 관계를 자동으로 도출하고, 다중 샘플을 활용한 베이지안 캘리브레이션을 통해 신뢰도 보정과 텍스트 생성 품질을 동시에 향상시킨다.
상세 분석
vPGM은 기존 LLM 프롬프트 기법과 베이지안 그래프 모델링을 통합한 혁신적 접근이다. 첫 단계인 Graphical Structure Discovery에서는 LLM에게 “잠재 변수와 그 의존 관계를 찾아라”는 메타프롬프트를 제공하고, 입력‑출력 예시와 도메인 제약을 함께 제시함으로써 인간 전문가가 수행하던 구조 학습 과정을 언어 기반으로 자동화한다. 여기서 도출된 변수 집합 Z={Z₁,…,Zₙ}와 관계 집합은 전통적인 DAG 형태와 동일하게 해석될 수 있지만, 각 조건부 확률분포(P(CPD))는 수식이 아니라 자연어 서술로 표현된다. 이는 파라미터 추정 비용을 크게 낮추고, 도메인 지식이 부족한 상황에서도 적용 가능하게 만든다.
두 번째 단계인 Prompting‑Based Inference에서는 “Zᵢ에 대한 사후 확률을 구하라”는 명령을 LLM에게 전달한다. LLM은 사전 학습된 언어 이해 능력을 활용해 “Zᵢ|Pa(Zᵢ)” 형태의 베이지안 업데이트를 텍스트 형태로 출력하고, 이때 출력된 확률값은 인간이 검증 가능한 형태로 제공된다. 중요한 점은 이 과정이 완전한 수치적 베이지안 연산이 아니라 LLM의 내부 확률 추정(soft‑max)과 외부 프롬프트 설계가 결합된 하이브리드 방식이라는 점이다.
세 번째 단계인 Predictions under Uncertainty에서는 얻어진 사후분포 P(Z|X)를 이용해 최종 목표 변수 Y에 대한 예측을 수행한다. 논문은 기대값 E_{P(Z|X)}
댓글 및 학술 토론
Loading comments...
의견 남기기