학습 기반 동적 스펙트럼 접근 알고리즘

본 논문은 인지 라디오 환경에서 1차 사용자 채널의 마코프 상태 변화를 POMDP로 모델링하고, 완전한 신호 분포 정보를 가정한 경우와 불완전한 경우에 각각 최적에 근접하는 그리디 채널 선택 정책과 파라미터 학습 알고리즘을 제시한다. 제안 방법은 간섭 확률 제약을 만족하면서도 상한 성능에 근접하며, 학습 기반 설계가 최악의 가정에 기반한 설계보다 우수함을 시뮬레이션을 통해 입증한다.

저자: Jayakrishnan Unnikrishnan, Venugopal Veeravalli

본 논문은 인지 라디오(Cognitive Radio, CR) 시스템에서 1차 사용자(Primary User, PU)의 채널 점유 상태가 마코프 체인으로 변한다는 가정 하에, 다중 인지 사용자가 협력적으로 채널을 탐지하고 접근하는 문제를 부분 관측 마코프 결정 과정(POMDP)으로 정식화한다. 시스템 모델은 N개의 PU 채널이 각각 ‘점유’(1) 혹은 ‘공백’(0) 상태를 갖고, 시간 슬롯마다 인지 사용자는 하나의 채널을 선택해 센싱을 수행한다. 센싱 결과는 PU 신호와 잡음의 합으로 표현되며, 신호 강도 분포는 사전에 알려졌다고 가정하거나, 파라미터화된 형태로 가정한다. **1. 완전 분포 정보 가정** 첫 번째 절에서는 PU 신호와 잡음의 정확한 확률 밀도 함수(pdf)가 알려진 경우를 다룬다. 이 경우, 인지 사용자는 현재 belief state b (각 채널이 공백일 사후 확률)를 베이즈 규칙에 따라 업데이트할 수 있다. 목표는 ‘즉시 보상’을 최대화하면서, PU에 대한 간섭 확률이 사전 정의된 임계값 ε 을 초과하지 않도록 하는 것이다. 저자들은 라그랑주 승수를 도입해 제약을 포함한 라그랑지안 L(b, a, λ)=E

학습 기반 동적 스펙트럼 접근 알고리즘

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기