대화형 다중에이전트 인과추론 시스템
초록
CausalAgent는 사용자가 데이터셋을 업로드하고 자연어 질문만으로 데이터 전처리, 인과 구조 학습, 편향 보정, 보고서 생성을 자동으로 수행하도록 설계된 대화형 다중에이전트 플랫폼이다. MAS, RAG, Model Context Protocol을 결합해 LLM의 추론과 외부 도구 실행을 분리하고, 시각화와 인터랙티브 피드백을 제공함으로써 인과 분석의 진입 장벽을 크게 낮춘다.
상세 분석
본 논문은 인과 추론 워크플로우를 완전 자동화하기 위해 세 가지 핵심 기술을 융합한 CausalAgent 시스템을 제안한다. 첫 번째는 다중에이전트 시스템(MAS)으로, LangGraph 기반 라우팅을 통해 Data Processing Agent, Causal Structure Learning Agent, Reporting Agent가 각각 독립적인 책임을 갖고 상태(state)를 공유한다. 이는 복잡한 파이프라인을 모듈화하고, 각 단계에서 발생하는 컨텍스트 손실을 최소화한다는 점에서 의미가 크다. 두 번째는 Retrieval‑Augmented Generation(RAG)이다. 인과 교과서와 논문을 벡터화한 지식베이스를 구축해 LLM이 생성하는 설명을 검증된 이론에 기반하도록 하여, 장기 추론 과정에서 흔히 발생하는 환각(hallucination)을 억제한다. 세 번째는 Model Context Protocol(MCP)로, LLM과 외부 도구(예: PC 알고리즘, OLC 기반 알고리즘) 사이의 인터페이스를 표준화한다. MCP는 프롬프트와 실행 결과를 명시적으로 구분함으로써 추론 로직과 실행 로직을 디커플링하고, 충돌 해결 및 오류 복구를 체계화한다.
시스템 구현 측면에서 저자들은 네 가지 전략을 강조한다. (1) RAG를 통한 지식 정착, (2) Supervised Fine‑Tuning(SFT)으로 LLM의 지시 수행 능력과 통계 결과 번역 정확도 향상, (3) 프롬프트 엔지니어링과 MCP 적용, (4) GLM‑4.6을 백본 모델로 채택해 복잡한 작업 분배와 다중 에이전트 간 협업을 지원한다. 특히 데이터 전처리 단계에서는 변수 이름을 자동 해석하고 “인과 분석 친화도” 점수를 제공함으로써 사용자가 데이터 품질을 직관적으로 파악하도록 돕는다. 인과 구조 학습 단계에서는 사용자의 자연어 지시와 데이터 특성을 분석해 PC 알고리즘이나 OLC 기반 알고리즘을 자동 선택하고, 결과를 인접 행렬 형태로 저장한다. 보고서 생성 단계에서는 RAG와 시각화 모듈을 결합해 알고리즘 선택 이유, 주요 인과 관계, 한계점 등을 포함한 종합 보고서를 자동 작성하고, 인터랙티브 그래프 뷰어를 통해 사용자가 노드 조작 및 시뮬레이션을 수행할 수 있게 한다.
시연에서는 Sachs 단백질 신호 데이터셋을 활용해 전체 파이프라인을 검증한다. 시스템은 데이터 업로드 → 자동 프로파일링 → PC 알고리즘 선택 → 인과 그래프 생성 → 보고서 작성 → 사용자 질의(예: Mek 억제 시 Erk 변화) → 시뮬레이션 응답 순으로 동작한다. 결과적으로 Akt와 Pka를 주요 조절자로 식별하고, 후속 질문에 대해 인과 그래프와 도메인 사전 지식을 결합해 합리적인 추론을 제공한다.
한계점으로는 현재 잠재 혼란 변수(laten confounder)를 완전히 다루는 구조 학습 알고리즘이 제한적이며, 정량적 인과 효과 추정 및 반사실(counterfactual) 분석 기능이 부재한다는 점을 인정한다. 또한 고위험 분야(의료, 금융)에서는 전문가 피드백 루프가 필요하다는 점을 미래 연구 방향에 제시한다. 전반적으로 CausalAgent는 인과 추론을 위한 인간‑AI 협업 패러다임을 제시하며, 복잡한 통계·컴퓨터 과학 지식 없이도 견고하고 재현 가능한 인과 분석을 수행할 수 있게 한다.
댓글 및 학술 토론
Loading comments...
의견 남기기