코드와 의도를 연결하는 RPG 인코더

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

RPG‑Encoder는 기존 레포지토리 에이전트가 겪는 의미·구조 단절을 해소하기 위해, 원시 코드를 의미‑의존성 그래프(RPG)로 변환하고, 커밋 기반 증분 업데이트를 통해 유지비용을 95 % 이상 절감한다. 이 통합 표현은 코드 생성과 이해를 역방향 프로세스로 묶어, SWE‑bench Verified에서 Acc@5 93.7 %·Live Lite에서 10 % 이상 향상, RepoCraft 재구성에서 98.5 % 커버리지를 달성한다.

상세 분석

이 논문은 레포지토리 수준 소프트웨어 엔지니어링을 “생성‑이해”라는 역대칭 사이클로 재구성한다. 기존 방법이 API 문서(의미 중심)와 의존성 그래프(구조 중심) 사이에서 각각의 장점을 살리지 못하고 단절된 표현을 제공하는 반면, RPG‑Encoder는 두 축을 동시에 담은 이중‑시점 그래프인 Repository Planning Graph(RPG)를 고해상도 중간 표현으로 만든다. 핵심은 세 가지 메커니즘이다. 첫째, Encoding 단계에서는 정적 분석과 LLM 기반 의미 추출을 결합해 각 함수·클래스에 ‘semantic feature f’와 코드 메타데이터 m을 부여하고, 이를 고수준 디렉터리 노드와 저수준 구현 노드로 계층화한다. 기능적 에지(E_feature)는 의도‑계층 관계를, 의존성 에지(E_dep)는 import·call 흐름을 포착해, 에이전트가 “무엇을”과 “어디서”를 동시에 인식하도록 만든다. 둘째, Evolution 단계는 커밋 diff를 파싱해 추가·수정·삭제를 그래프 수준에서 원자적으로 적용한다. 의미 변화가 감지될 때만 구조 재배치를 수행해, 작은 코드 변경이 전체 그래프 재생성을 유발하지 않도록 설계했으며, 실험에서는 유지비용을 95.7 % 절감했다. 셋째, Operation 단계는 SearchNode·FetchNode·ExploreRPG와 같은 통합 툴셋을 제공해, LLM이 RPG를 질의‑응답 인터페이스처럼 활용하도록 한다. 이때 고수준 의도 검색과 저수준 실행 흐름 탐색이 동일한 노드 집합을 공유하므로, “browse‑edit‑run” 루프가 자연스럽게 닫힌다. 평가에서는 SWE‑bench Verified에서 Acc@5 93.7 %를 기록, 기존 최첨단보다 10 % 이상 높은 정확도를 보였으며, RepoCraft 재구성에서는 98.5 % 커버리지와 86 % 테스트 통과율을 달성했다. 이는 의미‑구조 정합성을 동시에 보존한 RPG가 복잡한 코드베이스에서도 정밀한 로컬라이제이션과 완전한 복원을 가능하게 함을 입증한다. 전반적으로 이 논문은 레포지토리 이해·생성을 하나의 고정밀 그래프 표현으로 통합함으로써, 향후 멀티‑에이전트 협업, 자동 리팩터링, 장기 유지보수 등에 활용 가능한 기반을 제공한다.

코드와 의도를 연결하는 RPG 인코더

초록

상세 분석

댓글 및 학술 토론

의견 남기기