뇌혈관 혈류 시뮬레이션을 위한 HemeLB 성능 분석 및 모델링
초록
본 논문은 뇌혈관 혈류를 실시간으로 예측하기 위해 설계된 HemeLB 라티스볼츠만 시뮬레이터의 성능을 정량적으로 평가한다. 희소한 혈관 구조에 최적화된 HemeLB는 32,768 코어까지 확장 가능하며, 8,100만 격자점 규모에서 초당 295억 사이트 업데이트를 달성한다. 유체 비율이 5%인 고희소 경우에도 성능 저하가 11%에 불과하다. 또한 인터랙티브 스티어링·시각화 성능을 측정하고, 사용자가 실행 시간을 제한 내에서 최적 정확도를 선택하도록 돕는 예측 모델을 제시한다.
상세 분석
HemeLB는 혈관과 같은 매우 희소한 3차원 구조를 대상으로 설계된 라티스볼츠만(Lattice‑Boltzmann) 기반 혈류 시뮬레이터이다. 기존 LB 코드들은 전체 격자를 균등하게 분할해 메모리와 연산을 할당하는데, 이는 유체가 차지하는 비율이 낮은 경우 심각한 자원 낭비를 초래한다. HemeLB는 ‘Domain Decomposition with Sparse Representation’ 방식을 채택해, 실제 유체가 존재하는 셀만을 별도로 관리하고, 빈 셀은 압축된 형태로 저장한다. 이 설계는 메모리 사용량을 크게 줄이고, 통신량을 최소화한다는 두 가지 장점을 제공한다.
실험에서는 81 백만 격자점(≈81 M) 규모의 뇌혈관 모델을 사용했으며, 이는 실제 임상에서 흔히 다루는 해부학적 복잡성을 반영한다. 강력한 확장성을 검증하기 위해 최대 32 768개의 MPI 프로세스로 실행했으며, 이때 얻은 최대 성능은 초당 29.5 억 사이트 업데이트(site updates per second, SUS)였다. 이는 동일 규모의 전통적인 LB 코드 대비 2~3배 이상의 효율을 의미한다. 특히, 유체가 전체 격자의 5%만 차지하는 고희소 상황에서도 성능 저하가 11%에 머물렀다. 이는 통신 오버헤드와 로드 밸런싱이 효과적으로 제어되었음을 시사한다.
스티어링 및 시각화 측면에서도 HemeLB는 실시간 인터랙션을 지원한다. 사용자는 시뮬레이션 도중에 파라미터를 조정하거나, 관심 영역을 확대·축소하면서 즉시 결과를 확인할 수 있다. 이를 위해 GPU 기반 렌더링 파이프라인과 비동기식 데이터 전송 메커니즘을 도입했으며, 실험 결과 시각화 지연 시간이 0.2 초 이하로 유지되는 것을 확인했다.
핵심적인 기여는 성능 예측 모델이다. 모델은 입력 파라미터(격자 크기, 유체 비율, 코어 수)와 하드웨어 특성(네트워크 대역폭, 메모리 대역폭)을 기반으로 총 실행 시간을 추정한다. 회귀 분석을 통해 도출된 식은 실제 측정값과 평균 절대 오차가 5% 이하로 일치했으며, 이를 통해 사용자는 제한된 시간 안에 필요한 정확도와 해상도를 사전에 계획할 수 있다.
전반적으로 HemeLB는 희소 혈관 모델링에 특화된 설계, 뛰어난 확장성, 실시간 인터랙션, 그리고 실용적인 성능 예측 도구를 제공함으로써, 수술 전·중·후 의사결정 지원 시스템에 바로 적용 가능한 수준의 시뮬레이션 환경을 구현했다.