CaloHadronic: 고해상도 입자 검출기용 확산 기반 하드론 샤워 생성기
초록
CaloHadronic은 연속 정규화 흐름(CNF)과 트랜스포머 기반 EDM‑diffusion을 결합해, ILD의 전자·하드론 칼로미터(ECal·HCal) 전역에 걸친 하드론 샤워를 점 구름 형태로 고속·고정밀하게 생성한다. 입사 파이온 에너지 조건화와 ECal‑HCal 간 어텐션 메커니즘을 통해 복잡한 서브스트럭처와 층간 전이까지 재현한다.
상세 분석
본 논문은 고입자밀도(>10⁶ 셀) 칼로미터 시뮬레이션에서 발생하는 계산 병목을 해소하기 위해, 기존의 격자 기반 GAN·VAE 접근법을 넘어 점 구름(point‑cloud) 형태의 데이터 표현을 채택하였다. 핵심은 두 단계 모델링에 있다. 첫 번째 단계인 PointCountFM은 연속 정규화 흐름(CNF)을 흐름 매칭(flow‑matching) 방식으로 학습하여, 입사 파이온의 에너지에 조건화된 각 층(총 78층)별 히트 수를 예측한다. 여기서 CNF는 ODE 기반 변환을 사용해 역전파 시 Jacobian을 직접 계산할 필요 없이 MSE 손실만으로 효율적으로 학습한다. 두 번째 단계는 ECal과 HCal 각각에 대해 별도의 EDM‑diffusion 모델을 배치하고, 트랜스포머 인코더‑디코더 구조에 어텐션을 도입해 서로 다른 셀 크기와 물성(텅스텐·스틸) 차이를 학습한다. 특히 HCal 디퓨전은 ECal에서 생성된 점 구름을 추가 조건으로 받아, 입자 상호작용이 ECal에서 시작되어 HCal로 이어지는 물리적 전이를 정확히 포착한다.
모델 아키텍처는 기존 CaloClouds에서 영감을 얻었지만, 하드론 샤워의 복잡한 서브스트럭처(핵반응, 중간 입자 재생산 등)를 반영하기 위해 ‘Monotonic weighting’과 ‘Fourier embedding’ 두 가지 기술을 도입하였다. 전자는 EDM의 비단조 가중 함수를 단조화해 저노이즈 단계에서의 학습 효율을 높이고, 후자는 입력 좌표에 고주파 사인·코사인 변환을 적용해 고주파(세밀한 공간 변동) 정보를 더 잘 학습하도록 돕는다.
데이터 전처리는 Geant4 시뮬레이션으로부터 2‑D 스텝 정보를 추출해 78개의 레이어에 걸친 3‑D 점 구름(x, y, z, E)으로 변환하고, ECal은 1.7 mm × 1.7 mm, HCal은 10 mm × 10 mm 격자로 재샘플링하였다. 에너지 임계값(10⁻⁵ MeV) 이하 히트는 제거해 평균 1 700점, 최대 5 000점의 가변 길이 텐서를 구성한다. 정규화는 좌표와 로그 에너지에 각각 독립적으로 수행돼 학습 안정성을 확보한다.
성능 평가에서는 물리적 변수(에너지 분포, 전자·하드론 비율, 샤워 반경 등)의 1‑σ 차이를 기존 Geant4과 비교했을 때 5 % 이하로 유지했으며, 특히 HCal에서의 에너지 비선형성도 잘 복원했다. 상관관계 분석에서는 레이어 간 히트 수와 총 에너지의 Pearson 상관계수가 0.98에 달해, 모델이 전역적인 샤워 구조를 정확히 학습했음을 보여준다. 추론 속도는 GPU(A100) 기준 0.8 ms/샤워로, 전통적인 풀 시뮬레이션(수 초)보다 2 000배 이상 빠르다.
재구성 단계에서는 PandoraPFA 파이프라인에 직접 입력해, 입자 흐름 재구성 효율과 에너지 해상도가 원시 시뮬레이션과 거의 동일함을 확인했다. 이는 생성된 점 구름이 실제 디텍터 셀에 매핑될 때 물리적 노이즈와 셀 크기 차이를 충분히 반영했기 때문이다.
전체적으로 CaloHadronic은 (1) 점 구름 기반의 자유로운 기하학적 표현, (2) CNF‑flow‑matching을 통한 효율적인 포인트 수 예측, (3) 트랜스포머 기반 EDM‑diffusion에 어텐션을 결합한 ECal‑HCal 연계 모델링, (4) 고주파 임베딩과 단조 가중을 통한 학습 안정성 강화라는 네 가지 혁신 요소를 통합해, 차세대 고해상도 칼로미터 시뮬레이션에 실용적인 대안을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기