분산된 건축 지식 관리 자동화 비전
초록
본 논문은 요구사항, 설계 다이어그램, 코드, 문서 등 다양한 소프트웨어 아티팩트에 흩어져 있는 건축 지식을 자동으로 추출·연결·정합성 검사하고, 구조화된 지식베이스에 통합하는 파이프라인을 제안한다. 이를 통해 아키텍처 일관성 검증, 변경 영향 분석, 자연어 기반 질의응답을 지원함으로써 개발자와 설계자의 지식 접근성을 크게 향상시키는 것이 목표이다.
상세 분석
이 연구는 소프트웨어 아키텍처가 지식 중심임을 전제로, 현재 아키텍처 지식이 요구사항 문서, 설계 모델, 소스 코드, 주석, 회의 기록 등 이질적인 형태로 분산되어 있어 접근성과 일관성 유지에 큰 비용이 든다는 문제점을 명확히 짚어낸다. 저자는 이를 해결하기 위한 자동화 파이프라인을 네 단계로 설계한다. 첫 번째 단계는 전문화된 추출기를 구축해 텍스트 기반 아티팩트는 NLP와 대형 언어 모델(LLM)을 활용하고, 정적 분석과 프로그램 이해 기법으로 코드에서 구조·행위 정보를, 다이어그램은 파싱 기술로 컴포넌트 관계를 추출한다. 두 번째 단계는 통합 지식베이스 스키마 설계로, 온톨로지와 지식 그래프를 결합한 통일된 메타모델을 제시한다. 여기서는 추적 링크(Traceability Link)를 핵심 연결 고리로 삼아 각 아티팩트 간 의미적 연관성을 유지한다. 세 번째 단계는 정합성 검사 및 해결이다. 기존 연구의 규칙 기반, 머신러닝 기반, LLM 기반 방법을 혼합해 모순·불일치를 탐지하고, 자동 수정이 가능한 경우 자동 적용하고, 중요한 갈등은 인간 설계자에게 질문 형태로 전달한다. 네 번째 단계는 에이전트 기반 지속 모니터링으로, 파일 시스템·버전 관리 이벤트를 실시간 감지해 추출·정합성 검사를 트리거하고, 필요 시 인간에게 명시적 확인을 요청한다. 마지막으로 질의응답 인터페이스를 RAG(Retrieval‑Augmented Generation) 기법으로 구현해 자연어 질문에 대해 구조화된 지식과 LLM의 생성 능력을 결합해 정확하고 설명 가능한 답변을 제공한다. 논문은 또한 다중 모달 데이터 처리, 대규모 시스템에서의 컨텍스트 제한, LLM의 환각 방지와 설명 가능성, 오류와 실제 불일치 구분 등 실현 과정에서 마주칠 주요 도전 과제를 상세히 제시한다. 전체적으로 이 연구는 기존의 트레이스링크 복구, 모델 일관성 유지, 지식 그래프 기반 QA 연구를 통합·확장해, 건축 지식 관리의 자동화와 실시간화라는 새로운 패러다임을 제시한다는 점에서 학술적·실무적 의의가 크다.
댓글 및 학술 토론
Loading comments...
의견 남기기