새로운 격자 표현을 활용한 정사각형 QAM 구형 디코딩 복잡도 혁신

** 구형 디코딩(SD)은 최대우도(ML) 검출을 위한 저복잡도 알고리즘으로, 다양한 선형 채널에 적용되어 왔다. 그러나 경우에 따라 복잡도가 지수적으로 증가하거나 특정 가정 하에서만 다항식 수준으로 유지되는 문제가 있다. 복잡도에 가장 큰 영향을 미치는 요소는 탐색 반경과 트리 탐색 중 방문하는 노드 수이다. 반경 설정 문제는 기존 연구에서 많이 다루

새로운 격자 표현을 활용한 정사각형 QAM 구형 디코딩 복잡도 혁신

초록

**
구형 디코딩(SD)은 최대우도(ML) 검출을 위한 저복잡도 알고리즘으로, 다양한 선형 채널에 적용되어 왔다. 그러나 경우에 따라 복잡도가 지수적으로 증가하거나 특정 가정 하에서만 다항식 수준으로 유지되는 문제가 있다. 복잡도에 가장 큰 영향을 미치는 요소는 탐색 반경과 트리 탐색 중 방문하는 노드 수이다. 반경 설정 문제는 기존 연구에서 많이 다루어졌지만, 본 논문에서는 전체 복잡도를 크게 낮출 수 있는 새로운 SD 구조를 제안한다. 제안된 구조는 실수부와 허수부를 각각 독립적으로 디코딩할 수 있게 하는 새로운 격자 표현을 기반으로 하며, 이를 통해 부동소수점 연산(FLOPS)과 방문 노드 수가 현저히 감소한다. 시뮬레이션 결과, 2×2 시스템에서는 기존 SD 대비 80 %의 복잡도 감소, 4×4·6×6 시스템에서는 약 50 % 감소를 확인했으며, 이는 하드웨어 구현 요구사항을 크게 완화한다.

**

상세 요약

**
구형 디코딩은 원래 1980년대에 제시된 “구형 탐색” 개념을 기반으로, 수신된 신호 벡터가 사전에 정의된 구형(또는 타원) 안에 존재하는 후보점들만을 탐색함으로써 최대우도 검출의 연산량을 크게 줄이는 방법이다. 전통적인 SD는 복소수 형태의 MIMO 시스템에 직접 적용되며, 복소수 차원을 그대로 사용하기 때문에 실수·허수 성분이 서로 얽혀 있는 구조를 갖는다. 이때 탐색 트리는 각 레이어마다 전체 심볼 집합(예: 64‑QAM이면 64개의 후보) 중 하나를 선택하도록 설계되므로, 차원이 커질수록 방문 노드 수가 급격히 증가한다. 특히, 구형 반경을 충분히 크게 잡아야 하는 경우가 많아, 초기 반경 설정이 부적절하면 탐색이 거의 전체 트리를 탐색하는 상황에 이르게 된다.

본 논문이 제시한 핵심 아이디어는 “새로운 격자 표현”이다. 복소수 심볼을 실수와 허수 두 개의 독립적인 1‑D 격자 좌표로 분해하고, 이를 각각 별도의 트리 레이어에서 처리하도록 재구성한다. 이렇게 하면 각 레이어에서 고려해야 할 후보 수가 원래 복소수 차원에서의 √M(예: 64‑QAM이면 8) 수준으로 감소한다. 더 나아가 실수와 허수 부분을 독립적으로 탐색함으로써, 각 레이어의 비용 함수가 서로 영향을 주지 않게 되므로, 부분적인 구형 반경을 보다 정확히 계산할 수 있다. 결과적으로 초기 반경을 작게 잡아도 충분히 많은 후보가 포함되는 상황이 발생하고, 불필요한 노드 방문이 크게 억제된다.

복잡도 측면에서 저자는 FLOPS와 방문 노드 수 두 가지 지표를 사용하였다. FLOPS는 행렬 연산(특히 QR 분해와 역전파 단계)과 거리 계산에 소요되는 부동소수점 연산량을 의미한다. 새로운 격자 구조에서는 실수·허수 각각에 대해 별도의 거리 계산을 수행하지만, 후보 수가 감소함에 따라 전체 연산량이 오히려 감소한다. 시뮬레이션 결과는 2×2 MIMO에서 기존 SD 대비 80 %의 FLOPS 감소를 보여준다. 이는 2×2 시스템에서 복소수 차원(4 실수 차원)과 비교했을 때, 실수·허수 독립 처리로 인해 탐색 깊이가 절반 이하로 줄어들기 때문이다. 4×4·6×6 시스템에서도 약 50 %의 복잡도 감소가 관측되었는데, 이는 차원이 커질수록 후보 수의 제곱근 감소 효과가 상대적으로 작아지지만, 여전히 실수·허수 분리의 이점이 크게 작용한다는 것을 의미한다.

하드웨어 구현 관점에서도 중요한 의미가 있다. 기존 SD는 복잡한 비교 연산과 동적 반경 조정 로직이 필요해, FPGA나 ASIC 설계 시 높은 로직 사용량과 전력 소모를 초래한다. 제안된 구조는 각 레이어가 독립적인 연산 블록으로 구현될 수 있어 파이프라인화가 용이하고, 메모리 접근 패턴도 단순해진다. 따라서 실시간 고속 MIMO 수신기에 적용할 경우, 연산 지연(latency)과 전력 효율을 동시에 개선할 수 있다. 다만, 실수·허수 독립 처리가 가능한 것은 정사각형 QAM에 한정된다는 점과, 채널 행렬이 충분히 정규화되어야 QR 분해 후에 실수·허수 분리가 의미 있게 작동한다는 제한이 존재한다. 향후 연구에서는 비정형 QAM이나 비정규화된 채널에 대한 확장, 그리고 다중 사용자 MIMO(MU‑MIMO) 환경에서의 적용 가능성을 검토할 필요가 있다.

**


📜 논문 원문 (영문)

🚀 1TB 저장소에서 고화질 레이아웃을 불러오는 중입니다...