에이전트 기반 RAG를 활용한 소프트웨어 테스트 자동화와 하이브리드 벡터‑그래프 지식 관리
본 논문은 에이전트형 Retrieval‑Augmented Generation(RAG) 시스템과 하이브리드 벡터‑그래프 지식베이스를 결합해 테스트 계획·테스트 케이스를 자동 생성하는 방법을 제시한다. Gemini·Mistral 등 최신 LLM을 다중 에이전트 오케스트레이션에 활용해 문서 추적성을 유지하면서 정확도를 65 %에서 94.8 %로 끌어올렸다. 기업
초록
본 논문은 에이전트형 Retrieval‑Augmented Generation(RAG) 시스템과 하이브리드 벡터‑그래프 지식베이스를 결합해 테스트 계획·테스트 케이스를 자동 생성하는 방법을 제시한다. Gemini·Mistral 등 최신 LLM을 다중 에이전트 오케스트레이션에 활용해 문서 추적성을 유지하면서 정확도를 65 %에서 94.8 %로 끌어올렸다. 기업용 시스템 엔지니어링 및 SAP 마이그레이션 프로젝트에 적용한 결과, 테스트 기간을 85 % 단축하고 테스트 스위트 효율을 85 % 향상시켰으며, 비용 절감 35 %와 6개월 조기 가동을 달성했다.
상세 요약
이 연구는 기존 테스트 케이스 작성이 사람의 주관적 판단과 반복적인 수작업에 의존한다는 한계를 인식하고, 이를 해결하기 위해 세 가지 핵심 기술을 통합한다. 첫째, Retrieval‑Augmented Generation(RAG) 프레임워크를 기반으로 LLM이 외부 지식베이스에서 관련 정보를 동적으로 검색하도록 설계하였다. 여기서 사용된 하이브리드 벡터‑그래프 저장소는 텍스트 기반 임베딩(벡터)과 관계형 메타데이터(그래프)를 동시에 보유함으로써, 요구사항 문서와 설계 사양 사이의 복합적인 연관성을 빠르게 파악한다. 둘째, 다중 에이전트 오케스트레이션 레이어는 ‘요구사항 분석 에이전트’, ‘테스트 설계 에이전트’, ‘검증·추적 에이전트’ 등 역할별 특화 에이전트를 배치하고, 중앙 조정자를 통해 작업 흐름을 동기화한다. 각 에이전트는 자체 프롬프트와 메타‑피드백 루프를 갖추어, 초기 생성물의 품질을 지속적으로 개선한다. 셋째, Gemini와 Mistral 같은 최신 대형 언어 모델을 활용해 자연어 이해와 코드 생성 능력을 극대화하였다. 특히 Gemini는 멀티모달 입력을 지원해 설계 다이어그램을 이미지 형태로도 해석하고, 이를 텍스트 기반 요구사항과 연결한다. 실험에서는 기존 수동 방식 대비 정확도가 65 %에서 94.8 %로 상승했으며, 이는 테스트 케이스가 요구사항을 완전하게 커버하고 중복이 최소화된 결과이다. 또한, 문서 추적성을 보장하기 위해 각 테스트 케이스에 고유 식별자를 부여하고, 그래프 데이터베이스에 요구사항‑테스트 매핑을 저장함으로써 변경 관리 시 자동 업데이트가 가능하도록 설계하였다. 성능 평가에서는 엔터프라이즈 SAP 마이그레이션 프로젝트에 적용했을 때 테스트 사이클이 85 % 단축되고, 테스트 스위트의 실행 효율이 85 % 향상되었으며, 전체 프로젝트 비용이 35 % 절감되는 등 실질적인 비즈니스 가치를 입증했다. 이러한 결과는 에이전트 기반 RAG가 복잡한 기업 환경에서도 신뢰성 있게 테스트 아티팩트를 자동 생성할 수 있음을 보여준다.
📜 논문 원문 (영문)
🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...