3차원 핀칭 안테나 기반 ISAC 시스템을 위한 강화학습 빔포밍 최적화

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 3차원(3D) 핀칭 안테나 배열을 활용한 통합 sensing‑communication(ISAC) 시스템을 설계하고, 안테나 위치, TDMA 시간 할당, 전송 전력을 동시에 최적화하는 문제를 마르코프 결정 과정(MDP)으로 모델링한다. 이 복합 최적화 문제를 해결하기 위해 이종 그래프 신경망 기반 강화학습(HGRL) 알고리즘을 제안하고, 1D·2D 배치 대비 3D 배치가 통신률과 탐지 성능 모두에서 우수함을 시뮬레이션으로 입증한다.

상세 분석

본 연구는 기존 1차원·2차원 핀칭 안테나 배치가 갖는 고도( elevation) 다양성 부족과 제한된 빔 스티어링 범위를 극복하고자, 세 개의 직교 파형 가이드를 이용해 3차원 공간에 안테나를 자유롭게 배치하는 새로운 ISAC 구조를 제안한다. 안테나는 파형 가이드 상에서 “pinch” 동작을 통해 임의의 위치에 배치될 수 있어, LoS 경로를 다중 생성하고 근거리 구형파 전파를 활용함으로써 통신 사용자와 탐지 목표에 대한 빔포밍 효율을 동시에 향상시킨다.

시스템 모델은 베이스스테이션이 3개의 파형 가이드를 보유하고, 각 가이드당 N개의 핀칭 안테나(PA)를 배치해 총 M=3N개의 안테나를 구성한다. 각 시간 슬롯 t는 TDMA 방식을 적용해 사용자와 목표에 대한 전송 비율 q_{com,k,t} 를 할당하고, 전송 전력 p_{k,t} 를 조절한다. 신호 모델은 각 PA의 위상 이동 θ_{n,t}=2π|ψ_{p0}-ψ_{pn,a,t}|/λ_0 를 이용해 전파를 합성하고, 사용자와 목표에 대한 채널은 근거리 구형파 모델 h_{k,t}, h_{l,t} 로 표현된다.

목표는 모든 슬롯에 걸친 총 통신 데이터율 Σ_{t,k} R_{com,k,t} 를 최대화하면서, 각 목표의 최소 SNR Γ_{min} 을 만족하고, 전체 전력 및 안테나 간 최소 간격(δ) 제약을 충족시키는 것이다. 이 문제는 연속적인 안테나 위치, 시간 할당, 전력 변수로 이루어진 고차원 비선형·비볼록 최적화 문제이며, 전통적인 수치 최적화나 단순 강화학습으로는 탐색 공간이 너무 넓어 수렴이 어렵다.

이를 해결하기 위해 저자는 문제를 MDP로 재구성하고, 상태를 이종 그래프 G_t=(V,E) 로 표현한다. 노드 유형은 안테나, 사용자, 목표이며, 엣지 유형은 통신, 탐지, 간섭을 포함한다. 각 노드의 특징은 3D 위치와 유형 원-핫 인코딩을 포함한 d‑차원 벡터이며, 관계‑인식 이종 그래프 신경망(HetGNN) 을 통해 노드 임베딩 h_v^{(l+1)}=σ(∑{r∈T_e}∑{u∈N_r(v)}W_r^{(l)}h_u^{(l)}+W_0^{(l)}h_v^{(l)}) 로 업데이트한다. 전역 임베딩 h_t는 모든 노드 임베딩의 평균 풀링을 통해 얻어지고, 이는 연속 행동 a_t=

3차원 핀칭 안테나 기반 ISAC 시스템을 위한 강화학습 빔포밍 최적화

초록

상세 분석

댓글 및 학술 토론

의견 남기기