대형 액체 섬광 검출기에서 14C 광자 히트 억제를 위한 시공간 딥러닝
본 연구는 JUNO와 같은 대형 액체 섬광(LS) 검출기에서 14C 베타 붕괴에 의해 발생하는 저에너지 광자 히트를 정밀히 식별하기 위해, 시공간 그래프 신경망과 트랜스포머 기반 모델 3종을 제안한다. 시뮬레이션 데이터(각 이벤트에 1개의 e⁺와 1개의 14C가 중첩)에서 14C 히트 재현율을 25‑48% 달성하면서 e⁺와 14C를 혼동하는 비율을 1% 이하로 유지한다. 결과적으로 e⁺와 14C 히트가 강하게 겹치는 경우에도 전체 전하(에너지)…
저자: Junle Li, Zhaoxiang Wu, Gu
본 논문은 대형 액체 섬광(LS) 검출기, 특히 JUNO와 같은 20 kton 규모 검출기에서 14C 베타 붕괴에 의해 발생하는 저에너지 광자 히트가 신호(e⁺)와 겹쳐 에너지 해상도를 저하시키는 문제를 해결하고자 한다. 저자는 먼저 14C와 e⁺가 동시에 발생하는 상황을 시뮬레이션했으며, 각 이벤트는 0–5 MeV 범위의 e⁺와 0.04–0.16 MeV 에너지의 14C 베타 붕괴, 그리고 평균 400개의 다크 노이즈 히트를 포함한다. 히트는 (x, y, z, t, q, ℓ) 형태의 벡터로 표현되며, ℓ은 진실 라벨(다크, e⁺, 14C)을 나타낸다. 시간 차 ∆t = t₁₄C – tₑ⁺가 크면 단순 타이밍 컷으로 14C를 제거할 수 있지만, ∆t가 -100 ns~300 ns 구간에 있을 때는 두 신호가 강하게 겹쳐 기존 방법으로는 구분이 어렵다. 따라서 저자는 시공간 상관관계를 동시에 활용할 수 있는 딥러닝 모델을 설계했다.
첫 번째 모델은 Gated‑Spatiotemporal Graph Neural Network (Gated‑STGNN)이다. 히트를 그래프의 노드로 보고, 시간·거리 기준(Δt_nb = 10 ns, Δr_nb = 9 m)으로 이웃을 정의한다. 각 노드의 입력 특징은 정규화된 위치 단위벡터, 전하, 정규화된 연속 시간 및 시간 구간 인덱스로 구성된다. 전역 시간 흐름을 포착하기 위해 히트 수, 전하 합·평균, 방향벡터 평균·분산을 구간별로 집계하고, 이를 GRU에 입력해 시간 구간별 컨텍스트 벡터 c_b를 만든다. 메시지 패싱은 L = 3 레이어, 각 레이어는 MLP로 이웃 메시지를 생성하고 평균 풀링 후 GRUCell로 노드 상태를 업데이트한다. 최종 노드 상태는 3‑클래스 로짓으로 변환된다. 파라미터는 약 0.66 M개로 경량화되었다.
두 번째 모델은 Spatiotemporal Transformer with Scalar Charge Encoding (STT‑Scalar)이다. 히트를 시퀀스 토큰으로 취급하고, 위치·시간을 주기적 인코딩(5 차원)으로 변환한다. 전하 q는 MLP를 통해 32‑차원 임베딩으로 변환하고, 이와 위치·시간 인코딩을 결합해 d_model = 512 차원으로 투사한다. 6개의 트랜스포머 레이어(헤드 = 4)를 거쳐 각 토큰의 최종 표현을 얻고, MLP로 3‑클래스 로짓을 출력한다. 파라미터는 약 19 M개다.
세 번째 모델은 STT‑Vector이다. 여기서는 전하 정보를 18‑차원 벡터로 풍부하게 만든다. 각 히트 주변에 현재(±5 ns), 이전(−15 ns~−5 ns), 다음(5 ns~15 ns) 시간 프레임을 정의하고, 여러 반경(3–23 m)에서 전하 합과 비대칭을 계산한다. 이를 전역 및 지역 블록으로 구성해 총 18 차원(전역 5, 지역 4×3) 벡터를 만든다. 이 벡터와 위치·시간 인코딩을 결합해 트랜스포머에 입력한다. 전하 벡터는 14C와 e⁺의 미세한 전하 밀도 차이를 학습하도록 돕는다.
학습 데이터는 1 M 이벤트이며, 테스트는 24개의 독립 셋(6가지 e⁺ 에너지 × 4가지 z 위치)으로 구성된다. 평가 지표는 14C 재현율(Recall)과 e⁺→14C 오분류율(False Positive Rate)이다. 결과적으로 Gated‑STGNN은 14C 재현율 25–35%와 오분류율 <0.8%를 보였고, STT‑Scalar는 38–45% 재현율, STT‑Vector는 42–48% 재현율을 달성했다. 특히 ∆t가 작은 경우(히트가 겹치는 경우)에서 전하 재구성 해상도가 크게 개선되었으며, 전체 전하 분산이 기존 타이밍 컷 대비 30% 이상 감소했다. 이는 JUNO와 같은 대형 LS 검출기의 목표 해상도 3%@1 MeV 달성에 기여할 수 있다. 또한, 그래프 기반 모델은 파라미터 효율성이 뛰어나 경량화된 실시간 적용이 가능하고, 트랜스포머 기반 모델은 전하 밀도 정보를 활용해 복잡한 시공간 패턴을 학습한다는 장점이 있다. 논문은 향후 다중 14C pile‑up, 다른 배경(예: 210Bi) 및 실제 데이터 적용을 위한 도메인 적응 연구가 필요함을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기