LLM과 그래프 기반 RAG를 활용한 사이버 물리 시스템 DSM 자동 생성

LLM과 그래프 기반 RAG를 활용한 사이버 물리 시스템 DSM 자동 생성
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 대형 언어 모델(LLM), 검색‑증강 생성(RAG) 및 그래프 기반 RAG(GraphRAG)를 결합해 사이버‑물리 시스템(CPS)의 설계 구조 행렬(DSM)을 자동으로 생성하는 방법을 제안한다. 전동 드라이버와 CubeSat 두 사례를 대상으로, 사전 정의된 부품 간 관계 파악과 부품·관계 동시 식별 두 과제를 수행하고, DSM 요소별 정확도와 전체 아키텍처 일치를 평가한다. 실험 결과는 자동화 가능성을 보여주면서도 프롬프트 설계, 지식 그래프 구축, 대규모 추론 비용 등 여러 한계를 드러낸다.

상세 분석

이 연구는 기존 DSM 작성이 인력 집약적이고 시간 소모가 큰 문제점을 해결하고자, 최신 자연어 처리 기술과 그래프 데이터베이스를 융합한 새로운 파이프라인을 설계하였다. 먼저, 도메인 전문 문헌·데이터시트를 벡터화한 문서 저장소를 구축하고, 질문‑응답 형태의 프롬프트를 LLM에 전달한다. 여기서 얻어진 텍스트 응답은 엔터티 추출(NER)과 관계 추출(RRE) 모듈을 거쳐 구조화된 트리플(부품‑관계‑부품) 형태로 변환된다. 이러한 트리플은 Neo4j 기반의 지식 그래프에 삽입되어, 그래프 탐색을 통해 잠재적 누락 관계를 보완한다. 최종적으로, 그래프의 인접 행렬을 DSM 형식으로 매핑하고, 행/열 순서를 최소 피드백 루프와 모듈성 기준으로 재배열한다.

실험에서는 두 가지 사용 사례를 선정하였다. 전동 스크류드라이버는 비교적 제한된 부품 수와 명확한 기능적 연결을 가지고 있어, 사전 정의된 부품 목록만을 사용해 관계 매핑 정확도를 측정하였다. 반면 CubeSat은 수십 개의 서브시스템(전력, 통신, 자세 제어 등)과 복합적인 인터페이스를 포함하므로, 부품 식별 단계와 관계 추출을 동시에 수행하는 ‘전면 탐색’ 과제를 적용하였다. 평가 지표는 (1) 개별 DSM 셀의 정밀도·재현율, (2) 전체 매트릭스의 구조적 일치도(모듈 클러스터링 및 피드백 루프 최소화), (3) 인간 전문가와의 비교 점수이다.

결과적으로, 사전 정의된 부품 관계 파악에서는 평균 92 % 이상의 셀 정확도를 달성했으며, 부품·관계 동시 식별에서는 78 % 수준으로 다소 낮았다. 오류 원인은 (가) LLM이 문맥을 오해해 비슷한 용어를 혼동, (나) 그래프에 삽입된 트리플이 불완전하거나 중복, (다) DSM 재배열 알고리즘이 복합 피드백 루프를 완전히 최소화하지 못한 점으로 분석된다. 또한, 대규모 RAG 호출 시 토큰 비용과 응답 지연이 실시간 설계 지원에 장애가 될 수 있음을 확인하였다.

논문은 이러한 한계를 극복하기 위한 향후 연구 방향을 제시한다. 첫째, 도메인‑특화 프롬프트 템플릿과 사전 학습된 LLM(예: 인스트럭션 튜닝)을 결합해 추론 정확도를 높이는 방안, 둘째, 지식 그래프에 온톨로지 기반 검증 규칙을 삽입해 트리플 품질을 자동 정제하는 방법, 셋째, DSM 재배열을 위한 메타휴리스틱(예: 유전 알고리즘)과 그래프 신경망(GNN) 기반 예측 모델을 통합해 구조 최적화를 자동화하는 전략을 제안한다. 마지막으로, 오픈소스 코드와 데이터셋을 공개함으로써 연구 커뮤니티가 재현 및 확장을 용이하게 할 수 있도록 지원한다.


댓글 및 학술 토론

Loading comments...

의견 남기기