통합형 장기 과학 탐구 에이전트 InternAgent 1.5

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

InternAgent 1.5는 생성·검증·진화의 3개 서브시스템과 깊은 연구, 솔루션 정제, 장기 기억이라는 기본 역량을 결합한 통합형 AI 과학자이다. 교차학문 지식 그래프와 구조화된 인지 기억을 활용해 문헌 분석부터 실험 설계·실행·피드백까지 전 과정을 자동화하고, GAIA·HLE·GPQA·FrontierScience 등 벤치마크와 알고리즘·실험 발견 과제에서 최첨단 성능을 달성한다.

상세 분석

InternAgent 1.5는 기존 AI 과학자 시스템이 가지고 있던 “도메인‑특화”, “부분적 기본 역량”, “선형 최적화”, “짧은 운영 시간”이라는 네 가지 한계를 의식하고 설계된 통합 프레임워크이다. 핵심은 생성(Generation), 검증(Verification), 진화(Evolution)라는 3개의 협업 서브시스템이며, 각각은 깊은 연구(Deep Research), 솔루션 정제(Solution Refinement), 장기 기억(Long‑Horizon Memory)이라는 기본 역량에 의해 구동된다.

1️⃣ 깊은 연구 역량은 대규모 문헌 검색·통합·구조화 과정을 담당한다. 이를 위해 교차학문 지식 그래프(Cross‑Disciplinary Knowledge Graph)를 구축하고, 흐름 그래프(Flow Graph)와 그래프‑가이드 출력 합성(Graph‑Guided Output Synthesis) 기법을 적용해 논문, 데이터베이스, 특허 등 다양한 소스를 정형화한다. 이 그래프는 도메인 간 관계를 명시적으로 표현함으로써, 예를 들어 생물학적 메커니즘이 지구과학 모델에 미치는 영향을 자동으로 탐색한다.

2️⃣ 솔루션 정제 역량은 검증 단계에서 제시된 가설·방법론을 다중 라운드로 최적화한다. 생성된 실험 설계는 시뮬레이션, 수치 모델, 혹은 실제 웻‑랩 장비와 연동되며, 병렬 최적화 파이프라인을 통해 여러 변형을 동시에 평가한다. 특히 “Generative Design for Experimental Optimization” 모듈은 강화학습 기반 메타‑옵티마이저를 사용해 실험 파라미터 공간을 효율적으로 탐색한다.

3️⃣ 장기 기억 역량은 전략‑절차 기억(Strategy‑Procedural Memory), 작업‑에피소드 기억(Task‑Episodic Memory), 의미‑지식 기억(Semantic‑Knowledge Memory)으로 구분된다. 각 기억은 메타‑데이터와 추론 트레이스를 지속적으로 저장·인덱싱하여, 새로운 사이클이 시작될 때 과거 성공·실패 사례를 즉시 재활용한다. 이는 기존 시스템이 3~5 라운드 이후 성능이 정체되는 문제를 극복하고, 수십·수백 라운드에 걸친 장기 자율 탐구를 가능하게 한다.

벤치마크 평가에서는 GAIA(다중학문 질의 응답), HLE(고난이도 논리 추론), GPQA(전문 지식 QA), FrontierScience(최신 과학 논문 요약·비판) 등 네 가지 표준 테스트에서 최고 수준의 정확도와 점수를 기록했다. 특히 “문헌 기반 가설 생성 → 실험 설계 → 결과 해석” 전체 파이프라인을 그대로 적용한 실험에서는 인간 연구자와 비교해 1.8배 빠른 수렴 속도와 12% 높은 발견률을 보였다.

알고리즘·실험 발견 과제에서는 강화학습 정책 최적화, 테스트‑타임 적응 기법 등 AI 알고리즘을 자동 설계했으며, 생물학에서는 새로운 단백질‑리간드 결합 메커니즘, 지구과학에서는 미세플라스틱 이동 모델, 물리학에서는 양자 얽힘 실험 설계 등을 스스로 수행하고 논문 수준의 결과를 도출했다.

한계와 향후 과제로는 현재 시스템이 고가의 실험 장비와 클라우드 컴퓨팅 자원에 크게 의존한다는 점, 도메인‑특화 툴킷(예: 화학 합성 로봇)과의 인터페이스 표준화가 미비함을 들 수 있다. 또한 메모리 관리 비용이 라운드가 늘어날수록 급증하는 경향이 있어 효율적인 압축·요약 기법이 필요하다.

전반적으로 InternAgent 1.5는 “생성‑검증‑진화” 순환 구조와 그래프‑기반 지식 관리, 다중 메모리 레이어를 결합함으로써, 기존 AI 과학자 시스템이 도달하지 못했던 장기 자율 탐구와 교차학문 통합을 실현한 최초의 통합 프레임워크라 할 수 있다.

통합형 장기 과학 탐구 에이전트 InternAgent 1.5

초록

상세 분석

댓글 및 학술 토론

의견 남기기