분산 메모리 환경을 위한 도메인 분해 병렬 희소 선형 시스템 솔버

초록

본 논문은 대규모 희소 선형 시스템을 해결하기 위해 도메인 분해와 직접·반복 혼합 방식을 결합한 새로운 병렬 솔버를 제안한다. 각 서브도메인에서는 직접 방법으로 부분 행렬을 분해하고, 전체 시스템은 사전조건된 반복 방법으로 해결함으로써 직접법의 강인함과 반복법의 확장성을 동시에 확보한다. 실험 결과, 기존의 순수 직접법보다 높은 스케일러빌리티와 전통적인 사전조건 반복법보다 향상된 수렴성을 보였다.

상세 요약

제안된 솔버는 크게 두 단계로 구성된다. 첫 번째 단계는 그래프 기반 도메인 분해 기법을 이용해 전체 행렬을 여러 서브도메인으로 나누는 과정이다. 이때 각 서브도메인은 가능한 한 최소한의 경계(인터페이스) 노드를 갖도록 최적화되며, 이는 통신 비용을 감소시키는 핵심 설계 포인트다. 두 번째 단계에서는 각 서브도메인 내부에 대해 고성능 직접 해법(예: LU/Cholesky 분해)을 적용한다. 직접 해법은 서브도메인 규모가 상대적으로 작아 메모리 요구량이 제한적이며, 수치적 안정성을 보장한다.

전체 시스템의 결합은 인터페이스 자유도에 대한 Schur 보완 행렬을 구성하고, 이를 사전조건으로 사용한 Krylov 서브스페이스 반복법(예: GMRES, BiCGSTAB)으로 수행한다. 여기서 Schur 보완은 각 서브도메인의 직접 해법 결과를 이용해 효율적으로 계산되며, 전통적인 완전 직접법이 요구하는 전역 행렬의 조립을 피한다. 또한, 사전조건으로서 서브도메인 직접 해법을 활용함으로써 반복법의 수렴 속도가 크게 개선된다.

통신 패턴 측면에서, 본 접근법은 두 종류의 메시지 전달을 주로 사용한다. 첫 번째는 서브도메인 간 경계 값 교환으로, 이는 비동기적이며 작은 데이터량을 갖는다. 두 번째는 전역 반복 단계에서의 전역 내적 및 정규화 연산으로, 이는 집단 통신(예: MPI_Allreduce)으로 구현된다. 이러한 설계는 대규모 코어 수에서도 통신 병목을 최소화한다.

성능 분석에서는 이론적 복잡도와 실제 실행 시간을 비교하였다. 직접-반복 혼합 방식은 전통적인 순수 직접법이 O(N³) 수준의 복잡도를 갖는 경우, 서브도메인 규모를 p(프로세서 수)로 나누어 O((N/p)³) 로 감소시킨다. 동시에 반복 단계는 사전조건의 품질에 따라 선형 또는 준선형 수렴을 보이며, 전체 실행 시간은 O((N/p)³ + k·(N/p)·log p) 로 모델링된다(k는 반복 횟수). 실험 결과는 이 모델이 실제 스케일링과 잘 일치함을 보여준다.

결론적으로, 도메인 분해와 직접·반복 혼합 전략은 대규모 희소 시스템에 대한 견고한 솔루션을 제공한다. 직접법이 제공하는 수치적 안정성과 반복법이 제공하는 확장성을 동시에 활용함으로써, 기존 솔버가 직면하던 메모리 한계와 스케일링 한계를 효과적으로 극복한다.

초록

상세 요약

📜 논문 원문 (영문)