시뮬레이션 블랙박스에서 대형언어모델로 추출하는 시간‑지연 인과 규칙
초록
**
ruleXplain은 시뮬레이터가 만든 다변량 시계열 입력‑출력 데이터를 활용해, GPT‑4 기반 대형언어모델(LLM)에게 제한된 형식의 심볼릭 규칙 언어를 학습시킨다. 시뮬레이터로부터 다채로운 반사실 입력을 생성·클러스터링한 뒤, LLM에게 “입력 트렌드 → 출력 단계(피크, 플래토 등) 사이에 지연이 존재한다”는 규칙을 추론하도록 프롬프트한다. 생성된 규칙은 폐쇄‑루프에서 LLM이 새 입력을 만들고 시뮬레이터로 검증하면서 지속적으로 정제된다. 에피데믹 시뮬레이터(PySIRTEM)와 건물 에너지 시뮬레이터(EnergyPlus)에서 규칙의 재구성 정확도와 일반화 능력을 실험적으로 입증하였다.
**
상세 분석
**
본 논문은 기존 인과 추론 방법이 “통계적 연관성”에 머무는 반면, 실제 물리·생물 시스템에서 나타나는 “시간‑지연·단계적 변화”를 명시적으로 표현할 수 있는 규칙 기반 프레임워크를 제시한다는 점에서 혁신적이다. 핵심 아이디어는 (1) 시뮬레이터를 ‘정답 생성기’로 활용해, 목표 출력(Y_base)과 거의 동일한 여러 입력 시계열 X_p를 최적화 문제 P_LEARN(p) 를 통해 찾아낸다. 여기서 L_out은 출력 차이를 최소화하고, D_arch은 기존 솔루션과의 다양성을 보장하도록 설계돼, 다양한 반사실(counterfactual) 데이터를 확보한다. (2) 확보된 입력‑출력 쌍을 UMAP 차원 축소 후 K‑Means 클러스터링하여 대표적인 중심점(centroid)만을 LLM에게 제공함으로써, 과도한 정보와 중복을 제거한다. (3) LLM에게는 “□
댓글 및 학술 토론
Loading comments...
의견 남기기