VibeCodeHPC 슈퍼컴퓨터 자동 고성능 코드 튜닝

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 대형 언어 모델(LLM) 기반 다중 에이전트 시스템 VibeCodeHPC를 제안한다. Claude Code를 백엔드로 사용해 슈퍼컴퓨터 환경에서 코드 개발·자동 튜닝을 수행하며, 프로젝트 매니저, 시스템 엔지니어, 프로그래머, 지속 전달자 네 역할을 통해 사용자 개입을 최소화한다.

상세 분석

VibeCodeHPC는 HPC 특유의 복잡성을 해결하기 위해 네 종류의 전용 LLM 에이전트를 정의한다. 프로젝트 매니저(PM)는 전체 워크플로우를 조정하고 최적화 전략을 선택하며, 시스템 엔지니어(SE)는 하드웨어 사양·배치 시스템·모듈 로딩 정보를 수집·제공한다. 프로그래머(PG) 에이전트는 CPU(OpenMP·SIMD)와 GPU(CUDA·OpenACC) 코드를 생성·수정하고, 지속 전달자(CD)는 버전 관리·스크립트 익명화·결과 보고를 담당한다. 이러한 역할 분리는 컨텍스트 제한을 완화하고 각 에이전트가 전문화된 프롬프트와 메모리를 활용하도록 만든다. 시스템은 로컬 터미널에서 Claude Code를 실행하고, SSH·SFTP를 통해 슈퍼컴퓨터에 코드를 전송·컴파일·배치한다. 배치 잡의 실행 결과와 성능 측정값은 자동으로 수집돼 SE와 PG에게 피드백으로 전달되며, PM은 이를 기반으로 새로운 최적화 방향을 제시한다. 이 루프는 사용자가 요구 정의 문서를 제공하면 완전 자동으로 진행되며, 사용자는 실시간 로그와 tmux 기반 모니터링 창을 통해 진행 상황을 확인할 수 있다. 실험에서는 행렬 곱셈과 Jacobi 반복법 기반 Poisson 솔버를 대상으로 CPU 코드를 GPU 환경으로 이식·튜닝했으며, 다중 에이전트 구성에서 단일 에이전트 대비 개발 속도와 최종 성능이 유의미하게 향상됨을 보였다. 핵심 인사이트는(1) 역할 기반 에이전트 설계가 복잡한 HPC 작업을 단계별로 분할해 LLM의 컨텍스트 오버플로를 방지한다, (2) 자동화된 시스템‑하드웨어 정보 제공이 에이전트의 의사결정 정확도를 높인다, (3) 반복적 프롬프트와 성능 피드백 루프가 전통적인 자동 튜닝 기법과 결합될 때 더 빠른 수렴을 보인다.

VibeCodeHPC 슈퍼컴퓨터 자동 고성능 코드 튜닝

초록

상세 분석

댓글 및 학술 토론

의견 남기기