물리제약 조합형 결정론적 세계 모델 ARYA
초록
ARYA는 나노 모델을 계층적으로 결합하고 물리 제약을 강제하는 구조를 통해, 상태 표현·동역학 예측·인과·물리 인식·시간 일관성·일반화·학습·계획·제어 등 세계 모델의 7가지 핵심 요구사항을 모두 만족한다. 안전 커널을 아키텍처에 영구 삽입해 인간 통제권을 보장하고, 20초 이하 학습·선택적 언트레이닝·희소 활성화를 구현한다. 6개의 벤치마크에서 GPT‑5.2 등 최신 모델과 경쟁하며, 7개 산업 도메인에 실제 배포된 사례를 제시한다.
상세 분석
본 논문은 기존 대형 언어 모델 기반 세계 모델이 갖는 “단일 블랙박스·대규모 파라미터·학습·추론 비용” 문제를 근본적으로 재구성한다. 핵심 설계 원칙인 나노 모델(Nano Model)은 각각 독립적인 물리 솔버, 신호 처리기, 규칙 기반 엔진 등으로 구성되며, 필요 시에만 활성화되는 희소 활성화 메커니즘을 제공한다. 이는 모델 전체 파라미터 수를 0으로 유지하면서도 도메인 특화 기능을 즉시 제공한다는 점에서 혁신적이다.
계층적 시스템‑오브‑시스템‑오브‑시스템 구조는 전역 상태를 거대한 그래프(컨텍스트 네트워크)와 불확실성 전파를 담당하는 베리프 네트워크로 분리한다. 컨텍스트 네트워크는 엔티티·관계·제약·인과 관계를 명시적으로 저장하고, 트리형 혹은 DAG 형태의 서브그래프를 통해 필요한 부분만 탐색·연산한다. 이 설계는 복잡도가 전체 엔티티 수가 아닌 계층 깊이에 로그 스케일로 의존하게 하여, 인간 뇌의 계층적 처리와 유사한 효율성을 달성한다.
인과·물리 인식은 두 단계로 구현된다. 첫째, 물리 제약은 하드 필터 형태로 제약 레이어에 삽입돼, 물리 법칙 위반 결과를 즉시 차단한다. 둘째, 시뮬레이션 유닛이 컨텍스트 네트워크의 의존성 그래프를 따라 “what‑if” 시뮬레이션을 수행함으로써 Pearl식 인과 추론을 실현한다. 메타‑러닝 기반 자기 개선 루프는 관찰된 결과를 피드백해 중요한 인과 경로를 자동으로 재가중치화한다.
안전성은 “Unfireable Safety Kernel”이라는 불가역적 아키텍처 경계로 보장된다. 이 커널은 시스템 전반에 걸쳐 모든 실행 경로에 삽입되며, 자체 개선 엔진조차 우회할 수 없도록 설계되었다. 따라서 인간이 정의한 안전 정책이 코드 수준에서 강제되며, 사후적인 정책 적용이 아니라 설계 단계부터 안전이 내재된다.
학습 측면에서 논문은 “선택적 언트레이닝”(Selective Untraining)과 “20초 이하 학습 사이클”을 제시한다. 나노 모델은 독립적인 파라미터 집합을 갖지 않으므로, 기존 모델처럼 전체 파라미터를 재조정할 필요 없이 새로운 도메인에 대한 물리 규칙·데이터 파이프라인만 삽입하면 된다. 이는 콜드 스타트 문제를 근본적으로 해결하고, 산업 현장에 빠른 배치를 가능하게 한다.
성능 평가에서는 9개 외부 벤치마크 중 6개에서 최신 대형 모델(GPT‑5.2, Opus 4.6, V‑JEPA‑2)과 동등하거나 우수한 결과를 기록한다. 특히 인과 추론·물리 추론·PhD‑레벨 과학 질문 등 고난이도 영역에서 99.89% 정확도를 달성했다. 또한 7개 산업 도메인(우주, 제약 제조, 석유·가스, 스마트 시티, 바이오텍, 방위, 의료기기)에서 실제 운영 중인 사례를 제시해, 설계가 이론에 머무르지 않고 실무에 적용 가능함을 입증한다.
전체적으로 ARYA는 “파라미터‑프리·물리‑제약·계층‑그래프·안전‑핵심”이라는 네 축을 중심으로 세계 모델의 핵심 요구사항을 충족시키면서도, 확장성·효율성·안전성을 동시에 달성한 새로운 패러다임을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기