다항식 곱셈을 가속하는 새로운 DFT 기반 통합 알고리즘

초록

본 논문은 임의의 체 위에서 다항식 곱셈의 복잡도를 분석하고, 기존의 FFT·Schönhage‑Strassen·Schönhage·Cantor‑Kaltofen 알고리즘을 하나의 통합 프레임워크로 일반화한다. 특히 큰 매끄러운 차수를 갖는 DFT를 지원하지 않는 체에 대해서도 더 빠른 알고리즘을 제시하고, Q 체에 대해 DFT 기반 연속 적용만으로는 Schönhage‑Strassen 상한을 넘을 수 없음을 증명한다. 또한 양의 특성을 가진 체에서 Fürer의 정수 곱셈 기법을 다항식 곱셈에 옮기는 방법과 그 한계도 탐구한다.

상세 분석

논문은 “다항식 곱셈 → DFT → 순환 컨볼루션”이라는 전통적인 접근을 근본적으로 재구성한다. 저자는 먼저 체 F 에 대해 원시적인 원소 ω 가 존재하는 최소 차수 n 을 정의하고, 이를 이용해 “다중‑레벨 DFT” 구조를 만든다. 이 구조는 기존의 “큰 매끄러운 차수” 가정 없이도, 임의의 n 에 대해 효율적인 분할‑정복을 가능하게 한다. 핵심 아이디어는 (1) 다항식 A(x), B(x) 를 n‑차 원시 다항식으로 재표현하고, (2) 이들을 서로 다른 레벨의 DFT로 변환한 뒤, (3) 점별 곱을 수행하고, (4) 역 DFT와 CRT(중국 나머지 정리)를 결합해 결과를 복원하는 일련의 과정이다.

이때 레벨‑별 DFT는 각각 서로 다른 소인수 pᵢ 에 대한 원시 ωᵢ 를 사용해 구현되며, 각 레벨의 복잡도는 O(M(pᵢ)·log pᵢ) 형태가 된다. 여기서 M(k) 는 k‑차 다항식 곱셈의 비용을 의미한다. 저자는 이 식을 재귀적으로 풀어 M(n)=O(n·log n·log log n) 이라는 전역 상한을 얻는다. 이는 기존의 Schönhage‑Strassen이 달성한 O(n·log n·log log n) 과 동일하지만, 체 F 가 DFT‑가능한 매끄러운 차수를 제공하지 않아도 적용 가능하다는 점에서 의미가 크다.

또한 논문은 Q(유리수 체)에서 “연속적인 DFT 적용만으로는 상한을 개선할 수 없다”는 부정적 결과를 엄밀히 증명한다. 저자는 DFT‑기반 알고리즘이 결국 “다항식 → 원시‑다항식 → 순환 컨볼루션” 형태로 귀결된다는 사실을 이용해, 각 단계에서 발생하는 최소 연산량을 하한으로 설정한다. 그 결과, Q 상에서 DFT‑연속 적용만을 허용하면 Ω(n·log n·log log n) 의 복잡도 하한에 도달한다는 결론에 이른다.

마지막으로 양의 특성을 갖는 체 Fₚ 에 대해 Fürer의 정수 곱셈 기법을 차용한다. Fürer는 “초고속 FFT”를 이용해 정수 곱셈을 O(n·log n·2^{O(log* n)}) 시간에 수행한다. 저자는 이를 다항식 곱셈에 적용하기 위해, 먼저 p‑진법으로 다항식 계수를 표현하고, 이후 “프라임‑필드 DFT”와 “다중‑레벨 CRT”를 결합한다. 그러나 체 Fₚ 의 경우 원시 ω 의 존재가 제한적이므로, Fürer 방식의 “비정규‑점”을 구현하는 데 추가적인 비용이 발생한다. 논문은 이러한 비용을 정량화하고, 현재 알려진 최적 알고리즘보다 약 log log n 정도 개선된 복잡도를 얻을 수 있음을 보인다. 전체적으로 이 논문은 DFT 기반 다항식 곱셈의 이론적 한계와 실용적 확장 가능성을 동시에 조명한다.