AI‑네이티브 6G를 위한 무선 세계 모델

본 논문은 3차원 지형·채널 상태·사용자 궤적을 동시에 학습하는 다중모달 기반의 무선 세계 모델(WWM)을 제안한다. 80만 건 규모의 레이 트레이싱 시뮬레이션과 실제 6G 현장 측정 데이터를 결합해 사전학습하고, Joint‑Embedding Predictive Architecture와 Multi‑Modal Mixture‑of‑Experts Transformer를 통해 통합 표현을 획득한다. CSI 예측, 채널 압축·피드백, 빔 예측, 사용자 …

저자: Ziqi Chen, Yi Ren, Yixuan Huang

AI‑네이티브 6G를 위한 무선 세계 모델
본 논문은 차세대 6G 무선통신을 위한 AI‑네이티브 물리‑지능을 구현하고자, “Wireless World Model”(WWM)이라는 새로운 무선 세계 모델을 제시한다. 기존의 데이터‑드리븐 AI 접근법은 복잡한 전자기파 전파 메커니즘을 단순히 통계적 패턴 매칭으로 학습하기 때문에, 동적인 환경 변화에 대한 일반화가 제한적이었다. 이를 극복하기 위해 저자들은 (1) 물리‑기반 레이 트레이싱 시뮬레이션과 실제 6G 현장 측정 데이터를 결합한 대규모 하이브리드 멀티모달 데이터셋을 구축하고, (2) Joint‑Embedding Predictive Architecture(JEPA)를 기반으로 잠재 공간에서 미래 채널을 예측하도록 학습 목표를 설계했으며, (3) Multi‑Modal Mixture‑of‑Experts(MMoE) Transformer를 도입해 CSI, 3D 포인트 클라우드, UE 궤적이라는 세 가지 모달리티를 효율적으로 융합하였다. 데이터셋은 Sionna RT 레이 트레이싱 엔진을 활용해 70만 개 이상의 CSI 샘플을 생성하고, 5개 도시(뮌헨, 파리, 베이징 CBD, 금문성, 월스트리트)에서 실제 6G 프로토타입 장비로 수집한 현장 CSI를 추가하였다. 각 샘플은 시간‑주파수‑공간 3차원 CSI, 해당 지역의 3D 포인트 클라우드, 그리고 동기화된 UE 이동 궤적을 포함한다. 이렇게 풍부한 물리 정보를 제공함으로써 모델이 전파 경로, 반사·산란 구조, 이동체와의 상호작용을 직접 학습하도록 만든다. 모델 구조는 크게 인코더와 프리딕터 두 부분으로 나뉜다. 인코더는 각 모달리티별 전용 임베더(예: Conv3D + FFN for CSI, PointNet‑style 임베더 for point cloud, MLP for trajectory)를 통해 토큰화된 입력을 받아 MMoE Transformer에 전달한다. MMoE는 여러 전문가(Expert) 레이어를 갖고, 입력 토큰의 특성에 따라 동적으로 라우팅 가중치를 부여해 가장 적합한 전문가를 선택한다. 이를 통해 서로 다른 물리적 특성을 가진 데이터가 효과적으로 결합된다. 프리딕터는 인코더가 만든 통합 잠재 표현을 받아 미래 CSI를 시멘틱 레벨에서 예측한다. 예측된 잠재 벡터는 별도 디코더를 통해 실제 CSI 형태로 복원된다. 학습은 세 가지 마스크 기반 자기지도 과업을 교대로 수행한다. 첫 번째는 세밀한 CSI 마스크로, 채널의 특정 시간‑주파수 블록을 가려놓고 이를 복원하도록 한다. 두 번째는 거시 CSI 마스크로, 큰 구간을 마스킹해 전반적인 채널 구조를 추론하도록 강제한다. 세 번째는 궤적 마스크로, UE 위치 정보를 가려놓고 채널 변화를 통해 궤적을 역추정하도록 한다. 이러한 다중 과업은 모델이 전파 현상을 물리‑시멘틱하게 이해하고, 사용자 움직임과 채널 변화를 상호 연관짓는 능력을 키운다. 성능 평가에서는 네 가지 다운스트림 과제에 대해 기존 최첨단 모델과 비교하였다. (1) CSI 시간예측에서는 SGCS 0.80‑0.96(보지 못한 월스트리트 환경에서도 0.92)로 LSTM·WiF‑o 대비 평균 0.12(≈20 %) 향상. (2) 채널 압축·피드백에서는 압축 비율 1/8에서 복원 오류가 15 % 감소. (3) 빔 예측에서는 최적 빔 선택 정확도가 8 % 상승. (4) 사용자 위치추정에서는 평균 오류가 1.2 m에서 0.9 m로 25 % 개선. 모든 실험에서 백본을 고정하고 가벼운 헤드만 학습했음에도 불구하고, 단일모달 기반 WFMs(LWM, WiF‑o)보다 일관되게 우수한 성능을 보였다. 또한, Ablation Study를 통해 3D 포인트 클라우드와 궤적 정보를 제외한 단일모달 버전은 전반적인 성능이 7 %‑12 % 감소함을 확인했다. 이는 물리적 환경 정보를 제공하는 멀티모달 융합이 모델의 일반화와 견고성을 크게 향상시킴을 의미한다. 한계점으로는 (i) Transformer 기반 모델의 파라미터 수가 수백 억에 달해 실시간 베이스스테이션 적용 시 연산량·전력 소모가 높다. (ii) 레이 트레이싱 시뮬레이션이 실제 복잡한 환경(예: 동적 장애물, 날씨 변화)을 완전히 재현하지 못해 시뮬‑실 데이터 간 도메인 갭이 존재한다. (iii) 현재는 5G/6G 주파수 대역(28 GHz)와 제한된 안테나 구성에 국한돼 있어, 차세대 THz·광대역 환경에 대한 확장 검증이 필요하다. 향후 연구 방향으로는 (1) 지식 증류·프루닝을 통한 경량화, (2) 온라인 적응 학습으로 현장 환경 변화에 실시간 업데이트, (3) 다양한 주파수·대역폭·안테나 배열을 포함한 데이터 확장, (4) 멀티에이전트 협업 시나리오에서의 세계 모델 공유 등을 제시한다. 이러한 발전이 이루어지면, WWM은 6G 및 그 이후의 AI‑네이티브 무선 시스템에서 물리‑지능 기반 자율 최적화의 핵심 엔진으로 자리매김할 것으로 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기