2047 길이 사이클로토믹 FFT, 새로운 11점 순환 컨볼루션 기반
본 논문은 특성 2인 유한체에서 11점 순환 컨볼루션을 대체 푸리에 변환(AFT) 기반으로 설계하고, 이를 이용해 GF(2¹¹) 위에서 길이 2047인 사이클로토믹 FFT(CFFT)를 구현한다. 제안된 알고리즘은 43개의 곱셈만으로 11점 컨볼루션을 수행하며, 전체 CFFT는 78개의 곱셈과 약 5.3×10⁵개의 덧셈(공통 부분식 제거 후)으로 구현된다.
저자: Meghanad D. Wagh, Ning Chen, Zhiyuan Yan
본 논문은 특성‑2 유한체 GF(2^m) 상에서 Reed‑Solomon(RS) 디코딩에 필수적인 DFT 연산을 고속화하기 위해, 길이 2047인 사이클로토믹 FFT(CFFT)를 설계한다. 이를 위해 먼저 11점 순환 컨볼루션을 새롭게 정의한다. 저자들은 전통적인 DFT 대신 ‘대체 푸리에 변환(AFT)’이라는 11차원 변환을 도입하고, 변환 행렬 B와 그 역행렬 B⁻¹을 명시적으로 구성한다. AFT는 X₀와 X′(10개의 요소)로 구성되며, X′는 (x_i‑x₁₀)·W^i 형태의 기저를 사용한다. 여기서 W는 11번째 원시 11차 단위근이다.
AFT를 이용하면 두 11점 시퀀스 x와 y의 순환 컨볼루션을 다음과 같이 수행할 수 있다. 먼저 x와 y에 대해 AFT를 수행해 X와 Y를 얻고, X₀·Y₀와 X′·Y′를 각각 점별 곱한다. X₀·Y₀는 단순히 스칼라 곱이지만, X′·Y′는 10차원 벡터의 곱으로 복잡해진다. 이를 해결하기 위해 저자들은 X′·Y′를 Toeplitz 행렬 M과 X′의 곱으로 변환하고, 역 AFT 단계에서 A³ 행렬과 곱해지는 과정을 분석한다. 핵심은 R = (1/11)·A³·M 가 Toeplitz 형태임을 증명함으로써, 전체 연산을 Toeplitz‑product 알고리즘(길이 2와 5의 부분 Toeplitz 곱)으로 효율화한다는 점이다. 최종적으로 11점 순환 컨볼루션은 43개의 곱셈(특성‑2 필드에서는 XOR와 AND의 조합)만으로 구현된다.
다음으로, 위에서 만든 11점 컨볼루션을 이용해 길이 2047 CFFT를 구성한다. GF(2¹¹)에서 원시 다항식 x¹¹+x²+1을 선택하고, 2047=2¹¹‑1이라는 특성을 이용해 1개의 크기‑1 코셋과 186개의 크기‑11 코셋으로 분할한다. 각 코셋에 대해 정상 기저를 사용하면 블록 대각 행렬 L이 순환 행렬이 되며, 각 블록은 1점 또는 11점 순환 컨볼루션으로 표현된다. 따라서 전체 DFT는 블록 대각 행렬 L과 입력 벡터 f′의 곱으로 나타낼 수 있고, 11점 컨볼루션의 bilinear 형태(Q,R,P 행렬)와 결합해 전체 CFFT의 bilinear 형태를 얻는다.
복잡도 분석 결과, 제안된 2047‑CFFT는 78개의 곱셈과 2 154 428개의 직접 덧셈을 필요로 한다. 공통 부분식 제거(CSE) 알고리즘을 적용하면 덧셈 수를 529 720으로 감소시킬 수 있다. 이는 기존 1023‑길이 CFFT(곱셈 78, 덧셈 536 093)와 비교해 곱셈은 동일하지만, 덧셈은 약 6 % 감소한다는 점에서 의미가 있다. 또한, 11점 컨볼루션 자체가 기존 문헌에 없던 길이이므로, 2047을 초과하는 더 큰 사이클로토믹 FFT(예: 4095 등)에도 동일한 설계 원리를 적용할 수 있다.
논문의 한계로는 Toeplitz‑product를 구현하기 위한 구체적인 하드웨어 구조가 제시되지 않아 실제 VLSI 설계 시 성능 예측이 어려울 수 있다는 점, 43개의 곱셈이 특성‑2 필드에서는 XOR와 AND의 조합으로 구현되므로 실제 회로 면적과 지연을 정확히 평가하려면 더 정밀한 비용 모델이 필요하다는 점, 그리고 CSE 최적화 후에도 덧셈 수가 수십만 수준으로 남아 고속 디코더 구현 시 메모리 대역폭과 전력 소모가 병목이 될 가능성이 있다는 점을 들 수 있다.
결론적으로, 이 논문은 11점 순환 컨볼루션이라는 새로운 기본 연산을 제시하고, 이를 통해 2047‑길이 사이클로토믹 FFT를 효율적으로 구현하는 방법을 체계적으로 증명하였다. Toeplitz 구조를 활용한 bilinear 형태는 기존 FFT 설계에서 보기 드문 접근법이며, 향후 장거리 RS 디코딩 및 고속 오류 정정 시스템에 적용 가능성을 열어준다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기