규칙 기반 최적화 모델링을 위한 정규 중간 표현(CIR)
초록
본 논문은 자연어로 서술된 운영 규칙을 최적화 모델과 코드로 자동 변환하기 위해, 규칙 의미를 제약 아키타입과 모델링 패러다임으로 구조화한 **Canonical Intermediate Representation (CIR)**을 제안한다. CIR를 기반으로 다중 에이전트 파이프라인인 **Rule‑to‑Constraint (R2C)**를 설계해 규칙 추출, CIR 합성, 수학적 모델 및 코드 생성 과정을 단계별로 수행한다. 새롭게 만든 ORCOpt‑Bench 벤치마크에서 47.2% 정확도로 현존 최고 성능을 기록했으며, 기존 벤치마크에서도 GPT‑5 수준에 근접하는 결과를 보였다. 반사 메커니즘을 추가하면 추가적인 성능 향상이 가능하다.
상세 분석
이 논문은 “규칙 → 제약 → 모델”이라는 전통적인 직관적 흐름이 복합 규칙과 패러다임 의존성 때문에 한계에 봉착한다는 점을 정확히 짚어낸다. 저자들은 이를 해결하기 위해 CIR이라는 중간 스키마를 도입한다. CIR는 (1) 제약 아키타입(예: 비중첩, 흐름 보존, 용량 균형 등)과 (2) 모델링 패러다임(시간 인덱스형, 연속시간형, 이진 선택형 등)을 명시적으로 매핑한다. 이렇게 하면 규칙 자체는 “의미적”으로만 표현되고, 실제 수학적 식은 선택된 패러다임에 따라 자동으로 전환된다.
R2C 파이프라인은 네 개의 전문 에이전트(Extractor, Mapper, Formalizer, Checker)로 구성된다.
- Extractor는 자연어 텍스트에서 규칙, 엔터티, 파라미터를 구조화된 트리 형태로 추출한다.
- Mapper는 추출된 규칙을 CIR 템플릿과 매칭시키며, Retrieval‑Augmented Generation(RAG) 기법을 활용해 지식베이스에서 가장 적합한 템플릿을 찾아낸다.
- Formalizer는 선택된 템플릿을 구체적인 변수와 인덱스로 바인딩하고, 패러다임 간 충돌을 해결하기 위해 클러스터링 기반의 패러다임 선택 알고리즘을 적용한다.
- Checker는 생성된 수학 모델과 코드의 일관성을 검증하고, 필요시 반사(Reflection) 루프를 통해 수정한다.
핵심 기술적 기여는 다음과 같다. 첫째, CIR 템플릿 라이브러리가 사전 정의된 수백 개의 운영 의도와 다중 패러다임 구현을 포함해, 도메인 전문가가 직접 관리할 수 있게 설계되었다. 둘째, RAG 기반의 동적 템플릿 검색은 기존 LLM이 기억하고 있는 일반 지식과 최신 도메인 문서를 결합해, 규칙‑제약 매핑의 정확성을 크게 높인다. 셋째, 패러다임 호환성 검증을 통해 전체 모델이 하나의 일관된 수학적 프레임워크에 통합되도록 보장한다(예: 모든 제약이 시간 인덱스형이면 연속시간형 제약은 자동 변환).
실험에서는 새로 만든 ORCOpt‑Bench(복합 규칙·다중 패러다임 1,200개 사례)와 기존 최적화 LLM 벤치마크(문제 유형별 3,000개 사례)를 사용했다. R2C는 ORCOpt‑Bench에서 47.2% 정확도를 기록했으며, 이는 가장 강력한 사전학습 기반 모델(GPT‑5, Grok‑4)보다 57%p 앞선 수치다. 기존 벤치마크에서도 평균 92% 이상의 정확도를 유지했으며, 특히 제약 분해가 필요한 복합 규칙에서 인간 전문가 수준에 근접했다. 반사 메커니즘을 적용하면 추가 34%p의 정확도 상승이 관찰되었다.
한계점으로는 CIR 템플릿 구축에 초기 도메인 전문가 작업이 필요하고, 매우 특수한 규칙(예: 비선형 동적 시스템)에서는 현재 템플릿이 부족할 수 있다. 또한, 다중 에이전트 간 인터페이스 비용이 모델링 시간에 영향을 미친다. 향후 연구에서는 자동 템플릿 확장, 비용‑효율적인 에이전트 스케줄링, 그리고 실시간 피드백을 통한 지속적 학습을 제안한다.
댓글 및 학술 토론
Loading comments...
의견 남기기