자동화된 재료 크리프 데이터베이스 구축을 위한 스킬 기반 에이전트

자동화된 재료 크리프 데이터베이스 구축을 위한 스킬 기반 에이전트
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 대형 언어 모델(LLM)을 핵심 추론 엔진으로 활용하고, 텍스트·이미지 두 모달을 동시에 처리하는 ‘스킬 기반’ 에이전트 아키텍처를 제안한다. 5단계 파이프라인(문헌 수집·스크리닝·다중모달 추출·수식 검증·구조화 저장)을 통해 243편의 크리프 관련 논문에서 그래프와 수식을 자동으로 추출·검증하고, 90 % 이상의 성공률을 달성했다. 특히 시각 데이터와 텍스트 수식 간의 교차 검증(R² > 0.99)을 도입해 물리적 일관성을 확보했으며, 이를 기반으로 웹 인터페이스와 관계형 데이터베이스를 구축하였다.

상세 분석

이 연구는 기존의 규칙 기반 혹은 단순 OCR 파이프라인이 갖는 한계를 뛰어넘어, LLM 기반 에이전트가 ‘스킬’이라는 모듈형 기능을 통해 복합 인지 작업을 수행하도록 설계하였다. 스킬은 (I) Instruction Injection, (T) Scoped Tools, (C) Hard Constraints 로 구성돼, 각 단계마다 도메인 지식을 프롬프트에 주입하고, 허용된 툴 호출을 제한하며, 출력 형식을 강제한다. 이를 통해 텍스트에서 재료 조성·실험 조건·수식 등을 정확히 추출하고, 이미지에서 좌표계 인식·축 스케일 파싱·데이터 포인트 디지털화를 수행한다. 특히 ‘Physics Guardrail’ 스킬은 차원 일관성, 단조성, R² > 0.9 등 물리적 검증 기준을 적용해 LLM의 환각을 억제한다. 자동 스크리닝 단계에서는 전체 PDF를 LLM이 전체 텍스트로 읽고, 크리프 실험 데이터와 수식 존재 여부를 판단해 관련 논문만을 선별한다. 실험 결과는 20편의 인간 검증 샘플에 대해 Precision ≈ 0.95, Recall ≈ 0.92, F1 ≈ 0.94, Accuracy ≈ 0.94를 기록, 기존 수작업 대비 높은 효율성을 입증한다. 또한 그래프와 텍스트 수식 간 교차 검증에서 R² > 0.99를 달성해 데이터베이스의 물리적 자기일관성을 보장한다. 이러한 설계는 크리프와 같이 복잡한 그래프·수식이 동시에 존재하는 분야뿐 아니라, 광범위한 재료·화학·생물학 데이터 마이닝에도 확장 가능성을 시사한다.


댓글 및 학술 토론

Loading comments...

의견 남기기