코드2MCP: 깃허브 레포를 MCP 서비스로 자동 변환하는 에이전트 프레임워크

코드2MCP: 깃허브 레포를 MCP 서비스로 자동 변환하는 에이전트 프레임워크
안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

**
본 논문은 GitHub에 존재하는 방대한 오픈소스 코드를 Model Context Protocol(MCP) 표준에 맞는 서비스로 자동 전환하는 Code2MCP 시스템을 제안한다. 다중 에이전트와 Run‑Review‑Fix 자기수정 루프를 결합해 코드 분석, 환경 재현, API 설계, 테스트까지 전 과정을 최소한의 인간 개입으로 수행한다. 10개 분야 50개 레포지토리 실험에서 높은 성공률을 보이며, 기존 수동 구현 및 GPT‑4 템플릿 대비 효율성을 입증한다.

**

상세 분석

**
Code2MCP는 MCP 생태계의 ‘공급 측’ 문제를 해결하기 위해 설계된 최초의 자동화 파이프라인이다. 기존 연구는 주로 도구 선택·사용(툴 소비) 쪽에 집중했으며, 실제로는 수백만 개에 달하는 GitHub 레포지토리를 표준화된 서비스로 전환하는 과정이 병목이었다. 이를 해소하기 위해 저자들은 7개의 특화된 에이전트(Download, Environment, Analysis, Generation, Run, Review, Finalize)로 구성된 다중 에이전트 워크플로우를 제시한다.

  1. 코드 분석 단계 – Analysis Agent는 Deep Wiki와 같은 의미론적 도구를 활용해 레포지토리의 핵심 함수와 의도를 추출하고, ‘Code Report’를 생성한다. 이는 이후 API 설계의 청사진 역할을 한다.
  2. 환경 재현 – Environment Agent는 requirements.txt, environment.yml, Dockerfile 등을 자동 파싱해 격리된 컨테이너 환경을 구축한다. 이는 종속성 충돌이나 실행 오류를 사전에 차단한다.
  3. API 설계·생성 – Generation Agent는 LLM을 이용해 Code Report를 MCP‑compatible 인터페이스(함수 시그니처, JSON 스키마 등)와 어댑터 코드를 자동 생성하고, 기본 테스트 스위트를 함께 만든다.
  4. Run‑Review‑Fix 루프 – Run Agent가 테스트를 실행하고 실패 시 Traceback을 Review Agent에 전달한다. Review Agent는 오류 원인을 코드, 의존성, 인터페이스 불일치 등으로 진단하고, 구체적인 수정 계획(δ)을 Generation Agent에 제공한다. 이 과정을 최대 B번 반복해 로컬에서 검증된 서비스만을 최종 산출한다.
  5. 패키징·배포 – Finalize Agent는 mcp_output 디렉터리에 MCP 서비스 파일, README, CI 설정 등을 정리하고, 원 레포에 Pull Request를 자동 생성한다.

보안 측면에서도 격리된 워커와 파일시스템 제한, 네트워크 차단(필요 시 화이트리스트) 등을 적용해 악성 코드 실행 위험을 최소화한다.

평가에서는 바이오인포매틱스, 수학, 유체역학 등 10개 과학·공학 분야의 50개 레포지토리를 대상으로 성공률, 변환 시간, 수동 구현 대비 생산성을 측정했다. 대부분 레포에서 1~3회의 Run‑Review‑Fix 사이클만으로 테스트를 통과했으며, 전체 평균 성공률은 86%에 달했다. GPT‑4 기반 템플릿 방식에 비해 평균 변환 시간이 42% 감소하고, 수동 구현 대비 인력 비용이 70% 이상 절감되는 것으로 보고되었다.

한계점으로는 복잡한 GUI 기반 툴, 외부 API 의존성이 높은 프로젝트, 그리고 라이선스·저작권 검증 자동화가 아직 미흡하다는 점을 언급한다. 또한 현재는 과학·공학 라이브러리 중심으로 평가했으며, 일반 소프트웨어(예: 웹 프레임워크)로 확장하려면 추가적인 도메인‑특화 프롬프트와 테스트 설계가 필요할 것으로 보인다.

**


댓글 및 학술 토론

Loading comments...

의견 남기기