다중 GPU 기반 Swendsen와 Wang 다중 클러스터 알고리즘을 이용한 2차원 q상태 Potts 모델 시뮬레이션

다중 GPU 기반 Swendsen와 Wang 다중 클러스터 알고리즘을 이용한 2차원 q상태 Potts 모델 시뮬레이션

초록

본 논문은 CUDA 기반 다중 GPU 환경에서 Swendsen‑Wang 다중 클러스터 알고리즘을 구현하여 2차원 q‑상태 Potts 모델을 고속으로 시뮬레이션한다. 단일 GPU 구현을 확장해 MPI와 CUDA를 결합한 하이브리드 구조를 제안하고, TSUBAME 2.0 슈퍼컴퓨터의 Tesla M2050 256개 GPU를 이용해 q=2(이징) 모델의 임계 온도에서 L=65 536 크기의 격자를 37.3 spin‑flip/ns의 성능을 달성하였다. 확장성 테스트를 통해 256 GPU까지 거의 선형적인 속도 향상을 확인하였다.

상세 분석

이 연구는 통계 물리학에서 널리 사용되는 Swendsen‑Wang (SW) 군집 알고리즘을 GPU 클러스터 환경에 최적화한 점이 가장 큰 특징이다. 기존 단일 GPU 구현