AI 에이전트 기반 수소 저장 소재 탐색을 위한 DIVE 워크플로우

AI 에이전트 기반 수소 저장 소재 탐색을 위한 DIVE 워크플로우
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 그래프와 표에 묻힌 실험 데이터를 자동으로 추출·구조화하는 DIVE(Descriptive Interpretation of Visual Expression) 멀티‑에이전트 파이프라인을 제시한다. 4,000편 이상의 논문에서 30,000여 건의 고체 수소 저장 소재 데이터를 구축하고, 이를 기반으로 GPT 기반 설계 에이전트(DigHyd)를 구현해 2분 내에 새로운 후보 물질을 제시한다. 상용 멀티모달 모델 대비 10‑15%·오픈소스 대비 30% 이상의 정확도·완전도 향상을 입증하였다.

상세 분석

본 연구는 재료 과학 분야에서 가장 큰 병목 중 하나인 비정형 데이터(그림, 곡선, 표)의 자동화된 정제 문제를 해결하고자 한다. 기존의 멀티모달 LLM은 PDF를 텍스트와 이미지로 변환한 뒤 한 번에 전체 정보를 추출하지만, 그래프에 내재된 정량적 값(예: PCT 곡선, TPD 곡선, 방전 곡선 등)을 정확히 파악하지 못한다. DIVE는 세 단계의 에이전트 체인을 도입한다. 첫 번째 경량 모델은 논문 캡션을 스캔해 목표 그래프 존재 여부를 판단하고, 해당 그림·캡션·주변 텍스트를 두 번째 멀티모달 LLM에 전달한다. 여기서는 프롬프트 엔지니어링을 통해 “곡선의 각 포인트를 텍스트 형태로 변환하고, 적절한 키‑밸류 구조에 삽입하라”는 명령을 내린다. 결과적으로 이미지가 텍스트 설명으로 대체된 논문이 생성된다. 마지막 단계에서는 세 번째 LLM이 전체 텍스트를 파싱해 JSON 형태의 구조화 데이터를 출력한다.

정량적 평가에서는 인간이 수작업으로 라벨링한 100편 논문의 10,000여 개 데이터 포인트를 기준으로, Gemini 2.5 Flash 단일 모델을 직접 사용했을 때 총점 77.89점(정확도·완전도 각각 50점 만점)에서 DIVE 파이프라인(Gemini 2.5 Flash + DeepSeek R1)으로 87.21점, 약 12% 상승을 기록했다. 오픈소스 모델(LLaMA‑4‑Scout 등)은 30% 이상 점수 격차가 있었으며, DeepSeek‑Qwen3‑8B와 같은 경량 모델조차 DIVE 적용 시 84.6점으로 상용 모델에 근접하는 성능을 보였다.

데이터베이스 구축 후, 저자들은 GPT‑4 기반 설계 에이전트(DigHyd)를 구현했다. 이 에이전트는 자연어 질의(예: “Mg를 5 wt% 첨가한 LaNi₅의 저장 용량은?”)에 실시간으로 응답하고, 머신러닝 검증기(추출 데이터 기반 회귀 모델)를 통해 제안된 물질의 안정성·용량을 사전 평가한다. 역설계 워크플로우는 사용자가 정의한 목표(예: 5 wt% 이상, 600 K 이하 탈수소화 온도)를 입력하면, 데이터베이스 내 후보를 필터링하고, 조성·구조 변형을 탐색해 새로운 조합을 2분 이내에 제시한다.

시각화 결과는 0‑4 wt% 구간에서는 Ni, 4‑8 wt% 구간에서는 Mg, 8‑12 wt% 구간에서는 Li가 주로 사용된다는 원소‑용량 상관관계를 보여준다. 또한 LaNi₅‑Mg, MgH₂‑Ni, LiBH₄‑C/N 도핑이 각각 용량·압력·탈수소화 온도에 미치는 영향을 정량적으로 제시한다. 현재 DOE 2030 목표(>5.5 wt% 시스템 용량, >40 g L⁻¹ 부피 밀도 등)를 만족하지 못하는 기존 물질들의 한계를 명확히 드러내며, DIVE 기반 데이터와 DigHyd 에이전트가 이러한 격차를 메우는 설계 도구로서의 가능성을 입증한다.

핵심 기여는 (1) 그래프 기반 데이터 추출을 위한 프롬프트‑드리븐 멀티‑에이전트 파이프라인, (2) 인간‑AI 협업을 위한 자동화된 검증·수정 인터페이스(DigHyd Data Checking System), (3) 구축된 30k+ 데이터베이스를 활용한 초고속 역설계 워크플로우이며, 이는 다른 재료 분야에도 그대로 적용 가능하다.


댓글 및 학술 토론

Loading comments...

의견 남기기