효율적인 보이즈 함수 계산을 위한 최소극근사 기반 GPU 최적화 알고리즘
초록
본 논문은 GPU와 같은 고성능 연산 장치에서 데이터 이동 비용을 최소화하면서 보이즈 함수 F₀…Fₖₘₐₓ를 고정밀(오차 ≤ 5·10⁻¹⁴)으로 평가하기 위한 새로운 알고리즘을 제시한다. 비음수 실축을 세 구역(A, B, C)으로 나누어 A·B 구역에서는 사전 계산된 유리 최소극근사(rational minimax)식을, C 구역에서는 고전적인 비대칭 근사를 사용한다. 또한 위·아래 재귀 관계를 결합해 한 번의 근사만으로 다중 차수의 보이즈 함수를 동시에 계산한다. 최소극근사는 Remez 알고리즘을 직접 구현해 32차까지의 계수를 제공하며, 메모리 접근이 불규칙한 기존 테이블 기반 방법보다 연산량은 약간 늘지만 메모리 대역폭 요구가 현저히 낮아 GPU에서 높은 처리량을 달성한다.
상세 분석
이 논문은 양자화학에서 Gaussian형 궤도(GTO)를 이용한 전자 적분 계산 시 핵심이 되는 보이즈 함수 Fₖ(x)=∫₀¹ t^{2k} e^{-x t²} dt의 효율적 평가 문제를 다룬다. 기존 방법은 미리 구한 테이블을 선형 보간하거나, 저차 다항식·패드 근사를 이용해 메모리 접근을 최소화하려 했지만, GPU와 같은 대규모 병렬 아키텍처에서는 메모리 접근 지연이 연산보다 큰 병목이 된다. 저자들은 이를 해결하기 위해 ‘rational minimax approximation’이라는 최적 근사 기법을 채택한다. 최소극근사는 주어진 분자·분모 차수(n,m)와 가중함수 ρ(x) 하에서 최대 절대 오차를 최소화하는 유리함수 rₙ,ₘ(x)=pₙ(x)/qₘ(x)를 찾는 문제이며, Remez 알고리즘을 통해 등오실레이션 조건을 만족하도록 반복적으로 계수를 조정한다. 논문에서는 기존 라이브러리(Boost, AlgRemez, Baryrat)의 수렴·정밀도 문제를 지적하고, 직접 구현한 128‑bit(quadruple) 정밀도 Remez 코드를 공개한다. 이를 통해 0≤k≤32까지, 오차 ≤5·10⁻¹⁴을 만족하는 최소극근사 계수를 얻었다.
함수 정의역을 A=
댓글 및 학술 토론
Loading comments...
의견 남기기