LLM 기반 워크플로우 최적화로 자동차 소프트웨어 개발 혁신

본 논문은 자동차 산업의 멀티디서플리너리 소프트웨어 개발(MSD)에서 발생하는 문서·코드 간 비효율적 협업을 그래프 기반 워크플로우 모델링과 대형 언어 모델(LLM) 서비스를 단계적으로 도입함으로써 자동화한 사례를 제시한다. Volvo Group의 차량 내 API 시스템(spapi)를 대상으로 192개의 엔드포인트를 자동 생성했으며, F1 점수 93.7 %와 API당 개발 시간 5시간→7분으로 감소, 연간 약 979시간의 인력 절감 효과를 입증…

저자: Shuai Wang, Yinan Yu, Earl Barr

LLM 기반 워크플로우 최적화로 자동차 소프트웨어 개발 혁신
본 논문은 자동차 산업에서 복잡한 멀티디서플리너리 소프트웨어 개발(MSD) 과정이 겪는 비효율성을 해결하기 위해 그래프 기반 워크플로우 최적화와 대형 언어 모델(LLM) 서비스를 결합한 자동화 프레임워크를 제안한다. MSD는 도메인 전문가와 개발자가 서로 다른 형식과 도구 체인을 사용해 만든 문서·신호 정의·설계 사양을 조율하고 이를 코드로 변환해야 하는 복합 작업이다. 기존에는 GitHub Copilot과 같은 코딩 보조 도구가 개별 코딩 작업을 부분적으로 자동화했지만, 문서와 코드 사이의 번역·조정 과정을 자동화하지 못해 여전히 높은 인력 비용과 오류 위험이 존재했다. 연구팀은 Volvo Group의 차량 내 API 시스템인 spapi를 사례 연구 대상으로 삼았다. spapi는 192개의 RESTful 엔드포인트, 420개의 프로퍼티, 776개의 CAN 신호를 포함하며, 6개의 기능 도메인(운전자 생산성, 연결 시스템, 에너지 관리 등)에서 협업이 이루어진다. 기존 개발 흐름은 (1) 도메인 전문가가 요구사항·신호 정의·매핑 문서를 작성, (2) 개발자가 이 문서를 해석해 코드와 테스트를 작성, (3) 조정 그룹이 모호성을 해결하는 순환 구조였으며, 하나의 API를 완성하는 데 평균 10주(≈5시간의 실제 개발 시간 포함) 정도가 소요되었다. 문제점은 네 가지로 정리된다. 첫째, ‘아티팩트 파편화’로 인해 동일 정보가 여러 문서에 흩어져 있어 일관성 유지가 어려웠다. 둘째, ‘수동 번역 과부하’로 개발자가 문서와 신호 정의를 일일이 찾아 해석·코드화하는 작업이 비효율적이었다. 셋째, ‘모호성에 의한 재작업’이 빈번해 작은 신호 정의 하나가 며칠의 지연을 초래했다. 넷째, ‘조정 병목’으로 조정 그룹이 과부하돼 개발자가 직접 전문가에게 연락하는 비공식 경로가 생겨 관리가 복잡해졌다. 이러한 현상은 자동차뿐 아니라 의료·항공 등 도메인 지식이 소프트웨어에 깊이 녹아드는 분야에서도 공통적으로 나타난다. 해결책으로 연구팀은 작업 흐름을 ‘그래프’로 모델링했다. 정점(V)은 구체적인 아티팩트(예: OpenAPI 사양, CAN 신호 정의, 매핑 문서)이며, 간선(R)은 정보 의존성을 나타낸다. G = (V,R) 형태의 의존 그래프는 인간 간의 조정 노드를 명시적으로 드러내어 자동화 후보를 식별한다. 이후 단계별로 ‘번역’ 역할을 하는 인간 노드를 LLM 기반 마이크로서비스로 교체한다. 구체적인 서비스는 다음과 같다. 1. **Signal‑to‑Code Generator**: 신호 정의를 입력받아 차량 상태 접근 코드(예: CAN 버스 파싱 로직)를 자동 생성한다. 2. **API‑Signal Mapper**: OpenAPI 속성과 신호 정의를 매핑해 속성‑신호 관계를 도출하고, 필요한 변환 로직을 제시한다. 3. **Endpoint Assembler**: 위 두 서비스의 출력과 검증된 매핑 정보를 종합해 완전한 REST 엔드포인트 구현 코드를 생성한다. 각 서비스는 프롬프트 설계와 사전·사후 검증 파이프라인을 갖추어, 도메인 전문가가 검토·승인하는 피드백 루프를 유지한다. 그래프 변환은 ‘노드 교체’와 ‘간선 재연결’ 단계로 진행되며, 예를 들어 기존 ‘전문가 → 개발자 → 코드’ 2‑hop 경로가 ‘전문가 → LLM 서비스 → 코드’ 1‑hop 경로로 단축된다. 이러한 변환은 단계별로 정량적 지표(F1 점수, 개발 시간)를 측정해 회귀 위험을 최소화한다. 실험 결과는 다음과 같다. 자동화된 파이프라인은 192개의 실제 API를 생성했으며, 평균 F1 = 93.7 %를 달성했다. API당 개발 시간은 기존 5시간(≈300 분)에서 7분 이하로 감소했으며, 전체 프로젝트 기준 979시간 이상의 인력 절감 효과가 추산된다. 현장 설문에서는 도메인 전문가와 개발자 모두 커뮤니케이션 효율성에 대해 5점 만점에 각각 4.80점, 4.67점을 부여해 높은 만족도를 보였다. 논문은 또한 한계와 향후 과제를 논의한다. LLM이 생성한 코드는 여전히 인간 검증이 필요하며, 특히 자동차와 같은 안전‑중요 시스템에서는 규제 준수와 인증 절차가 자동화된 결과물에 추가 검증을 요구한다. 보안·안전성 검증을 형식 검증 툴과 연계하거나, LLM 출력에 대한 자동 테스트 생성 메커니즘을 도입해 신뢰성을 강화할 필요가 있다. 또한, 제안된 그래프 기반 워크플로우 모델은 다른 도메인(의료, 항공, 에너지 등)에도 적용 가능하도록 템플릿화하고, 도메인 특화 프롬프트와 검증 규칙을 확장하는 연구가 요구된다. 결론적으로, 이 연구는 “워크플로우 자체를 자동화한다”는 새로운 관점을 제시함으로써, 멀티디서플리너리 소프트웨어 개발에서 인간 조정 비용을 크게 줄이고, 품질을 유지하면서도 개발 속도를 급격히 향상시킬 수 있음을 실증하였다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기