6G 시대 협업형 LLM 에이전트 핵심 프레임워크 CORE

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 6G 네트워크와 대형 언어 모델(LLM)을 결합해, 계층형 엣지 인프라 전반에 걸쳐 역할별 LLM 에이전트를 분산 배치하고, 실시간 인식·역할 오케스트레이션·파이프라인 병렬 실행을 통합한 CORE 프레임워크를 제안한다. 역할 친화 스케줄링 알고리즘으로 자원·지연을 고려해 최적 역할 할당을 수행하고, 실제 산업 자동화 엣지 플랫폼에 적용해 효율성과 작업 완료율을 크게 향상시킨다.

상세 분석

CORE는 6G 환경에서 발생하는 ‘자원 파편화·이질성’ 문제를 해결하기 위해 세 가지 핵심 모듈을 설계했다. 첫째, 실시간 인식 레이어는 모바일 에이전트가 멀티모달 센서 데이터를 전처리하고, 상황 인식을 담당한다. 여기서 사용된 경량화된 전처리 파이프라인은 초저지연 요구를 만족하도록 설계되었으며, 인식 결과는 상위 레이어에 즉시 전달된다. 둘째, 동적 역할 오케스트레이션 레이어는 각 LLM에게 ‘PerceptionAgent’, ‘VideoAgent’, ‘MapAgent’ 등 사전 정의된 역할을 부여하고, 역할 친화 스케줄링(Role‑Affinity Scheduling) 알고리즘을 통해 현재 네트워크 대역폭, 장치 연산 능력, 작업 우선순위 등을 실시간으로 평가한다. 이 알고리즘은 이분 매칭과 강화학습 기반 비용 함수 최적화를 결합해, 역할‑자원 매핑의 전역 최적을 근사한다. 셋째, 파이프라인 병렬 실행 레이어는 작업을 DAG 형태로 분해하고, Model Context Protocol(MCP)을 이용해 서로 다른 엣지 노드 간에 중간 결과를 교환한다. 이를 통해 복잡한 추론 과정을 여러 단계에 걸쳐 동시에 수행함으로써 전체 처리량을 2~3배 향상시켰다.
핵심 혁신은 ‘역할 기반’이라는 개념이다. 기존 연구는 LLM을 단일 엔티티로 취급해 중앙집중식 혹은 단일 엣지 디바이스에 의존했지만, CORE는 역할을 분리해 각 역할에 최적화된 경량 모델 또는 파라미터 공유 LLM 인스턴스를 배치한다. 이렇게 하면 메모리·연산 요구를 분산시켜, 저사양 모바일에서도 고차원 추론이 가능해진다. 또한, 역할 친화 스케줄링은 작업 특성(예: 멀티모달 융합, 자연어 이해)과 자원 특성(GPU 메모리, CPU 주파수) 사이의 매칭을 정량화해, 동적 워크로드 변동에도 안정적인 지연 보장을 제공한다. 실험에서는 스마트 시티 교통 관리, 산업 현장 이상 탐지, 원격 의료 진단 등 3가지 시나리오에서 기존 중앙집중식 LLM 서비스 대비 평균 38%의 지연 감소와 45% 이상의 작업 성공률 향상을 기록했다. 마지막으로, 실제 6G 엣지 테스트베드에 배포한 결과, 전력 소비는 22% 절감되었으며, 시스템 복원력(노드 장애 시 재스케줄링 시간)은 0.8초 이하로 유지되었다. 이러한 결과는 CORE가 6G 기반 초저지연·고신뢰 서비스에 실용적으로 적용될 수 있음을 입증한다.

6G 시대 협업형 LLM 에이전트 핵심 프레임워크 CORE

초록

상세 분석

댓글 및 학술 토론

의견 남기기