Gemini 3 Pro를 넘어 대규모 LLM 라우팅 및 집계 재조명
📝 원문 정보
- Title: Beyond Gemini-3-Pro: Revisiting LLM Routing and Aggregation at Scale
- ArXiv ID: 2601.01330
- 발행일: 2026-01-04
- 저자: Shengji Tang, Weihao Lin, Jingqi Ye, Hao Li, Bo Zhang, Shuyue Hu, Tao Chen, Wangli Ouyang, Lei Bai, Peng Ye
📝 초록 (Abstract)
대형 언어 모델(LLM)의 급속한 발전으로 Gemini‑3‑Pro가 새로운 성능 기준을 제시했다. 본 연구에서는 단일 모델을 무한히 확장하는 방식 대신, 여러 LLM이 협업하는 집단 지능을 탐구한다. 기존 라우팅·집계 체계의 세 가지 주요 병목을 재조명한다. 첫째, 현재 트레인프리 라우터는 텍스트 유사도에만 의존하는 질의 기반 패러다임에 한정된다. 둘째, 최신 집계 방법은 정적이며 작업별 최적 집계자를 선택하지 못한다. 셋째, 라우팅과 집계 간의 상보성이 충분히 활용되지 않는다. 이를 해결하기 위해 JiSi라는 새로운 프레임워크를 제안한다. JiSi는 (1) 문제 난이도와 의미 정보를 동시에 포착하는 질의‑응답 혼합 라우팅, (2) 집계자와 도메인 역량을 공동 평가하는 지원‑집합 기반 집계자 선택, (3) 라우팅과 집계의 장점을 동적으로 전환하는 적응형 라우팅‑집계 스위치를 도입한다. 9개 벤치마크에 대한 포괄적 실험 결과, JiSi는 10개의 오픈소스 LLM을 활용해 비용을 47 % 절감하면서 Gemini‑3‑Pro를 능가했으며, 기존 베이스라인보다도 우수한 성능을 보였다. 이는 집단 지능이 인공 일반 지능(AGI)으로 가는 새로운 길이 될 수 있음을 시사한다.💡 논문 핵심 해설 (Deep Analysis)

JiSi 프레임워크는 이러한 문제점을 세 가지 혁신적인 모듈로 해결한다. ① Query‑Response Mixed Routing은 질문 자체와 모델이 반환한 초기 응답을 동시에 고려해 라우팅 스코어를 산출한다. 이는 “문제 난이도”를 암묵적으로 추정함으로써, 복잡한 질문에 대해 더 강력한 전문가 모델을 할당할 수 있게 한다. ② Support‑Set‑based Aggregator Selection은 후보 집계자들의 도메인 전문성뿐 아니라, 현재 라우팅된 모델들의 응답 집합을 기반으로 집계자를 평가한다. 이중 평가 체계는 작업별 최적 집계자를 동적으로 선택하게 하여, 정적 집계의 한계를 극복한다. ③ Adaptive Routing‑Aggregation Switch는 라우팅과 집계 사이를 상황에 맞게 전환한다. 예를 들어, 질문이 명확히 정의된 경우 라우팅을 우선시하고, 다중 관점이 요구되는 경우 집계를 강화한다.
실험 설계는 9개의 서로 다른 베ン치마크(자연어 이해, 코드 생성, 요약, 추론 등)를 사용해 JiSi와 기존 라우팅·집계 기반 시스템, 그리고 단일 대형 모델인 Gemini‑3‑Pro를 비교한다. 특히 비용 효율성 측면에서 “47 % 비용 절감”이라는 수치는 동일한 성능을 달성하면서도 연산량과 API 호출 비용을 크게 낮춘 것을 의미한다. 다만, 비용 계산이 클라우드 서비스 요금 기준인지, 혹은 GPU 시간 기준인지 명시되지 않아 재현 가능성에 약간의 의문이 남는다. 또한, 10개의 오픈소스 LLM을 사용했음에도 각 모델의 사전 학습 데이터와 파라미터 규모가 크게 다르기 때문에, 성능 차이가 라우팅·집계 기법보다 모델 자체의 차이에 기인했을 가능성도 있다.
한계점으로는 (1) 라우팅 단계에서 초기 응답을 생성하는 비용이 추가되므로, 실제 실시간 서비스에서는 지연 시간이 증가할 수 있다. (2) 지원 집합 기반 집계자 선택이 복잡한 최적화 문제로 전환될 경우, 스케일업 시 계산 복잡도가 급격히 상승할 위험이 있다. (3) 현재 실험은 주로 영어 데이터에 초점을 맞추고 있어, 다언어 환경에서의 일반화 가능성은 추가 검증이 필요하다.
그럼에도 불구하고 JiSi는 “라우팅‑집계 상호 보완성”을 실질적인 시스템 설계에 반영한 최초의 시도 중 하나이며, 향후 LLM 에코시스템이 단일 초대형 모델이 아닌, 다수의 전문 모델이 협업하는 형태로 전환될 가능성을 제시한다. 이는 모델 개발 비용을 낮추고, 다양한 도메인에 특화된 모델을 손쉽게 통합할 수 있는 새로운 패러다임을 열어준다.
📄 논문 본문 발췌 (Translation)
📸 추가 이미지 갤러리