그래프 신경망 기반 다중모달 트랙 재구성으로 효율 75% 달성
초록
본 논문은 Belle II 실험의 중앙 드리프트 챔버(CDC)와 실리콘 정점 검출기(SVD) 데이터를 하나의 그래프 신경망(GNN)으로 결합해 트랙 찾기를 수행한다. 객체 응축(Object Condensation) 손실을 이용해 다중 입자 수가 가변적인 상황에서도 자동으로 클러스터링하고, 초기 트랙 파라미터를 동시에 예측한다. 실험 시뮬레이션 결과, 전통적인 단계별 트랙 찾이 대비 효율이 48 %→74.7 %로 크게 상승하고, 순도도 5.5 %p 향상되었다.
상세 분석
이 연구는 Belle II 검출기의 이질적인 구조—CDC는 2차원 드리프트 타임, SVD는 3차원 스트립 클러스터—를 하나의 비정형 그래프 형태로 통합한다는 점에서 혁신적이다. 모든 히트는 노드로 표현되고, CDC와 SVD 각각의 특성을 반영한 피처(예: CDC는 드리프트 타임·와이어 기하, SVD는 좌표·전하·신호대잡음비)가 하나의 고정 길이 벡터에 병합된다. 탐지기 구분 플래그와 제로 패딩을 통해 누락된 피처를 처리하고, 이후 완전 연결 레이어로 잠재 공간에 매핑한다.
그래프 구조는 GravNet 블록을 이용해 동적으로 이웃을 선정한다. GravNet은 거리 가중치를 기반으로 메시지를 전달해 지역적 관계를 학습하므로, CDC의 축형·스테레오 레이어와 SVD의 층 구조를 별도 정렬 없이 자연스럽게 연결한다. 이는 기존의 CDC‑only CAT Finder가 CDC 내부에서만 작동하던 한계를 극복하고, SVD 히트까지 동시에 고려하게 만든 핵심 메커니즘이다.
학습 목표는 객체 응축(Object Condensation) 손실이다. 각 노드는 (1) 클러스터 공간 좌표, (2) 응축 점수 β, (3) 초기 트랙 파라미터(모멘텀, 시작 위치, 전하)를 예측한다. β가 높은 노드는 클러스터 중심(트랙 시드)으로 선택되고, 손실은 β에 비례해 파라미터 회귀 오차를 가중한다. 동시에 서로 다른 입자에 속한 히트는 클러스터 공간에서 멀어지도록 하는 반발 항과, 배경 히트를 억제하는 노이즈 억제 항이 포함된다. SVD 히트는 수가 적어 학습 시 기여도가 낮아지므로, 논문에서는 손실에 4배 가중치를 부여해 균형을 맞춘다.
데이터셋은 Belle II 전 detector 시뮬레이션에 실제 빔 배경과 노이즈 모델을 삽입한 realistic full‑simulation을 사용한다. 훈련은 다양한 전하·모멘텀·정점 변위(0–100 cm)를 균일하게 샘플링한 이벤트로 구성되며, 평가용으로는 2개의 변위 뮤온 입자를 포함한 이벤트를 이용한다. 트랙 효율은 SVD 혹은 CDC에 최소 1개의 히트가 있는 입자 대비 재구성된 트랙 비율로 정의하고, 순도는 재구성된 트랙 중 진짜 입자와 매칭된 비율로 측정한다.
실험 결과, 기존 Baseline Finder(효율 48.0 %, 순도 92.2 %)와 CDC‑only CAT Finder(효율 68.5 %, 순도 93.8 %)에 비해, 제안된 BA T Finder는 평균 효율 74.7 %와 순도 97.6 %를 달성한다. 특히 전이 영역(15 cm 이하)에서 SVD 히트를 활용함으로써 작은 반경 트랙의 재구성이 크게 개선되었으며, 큰 반경에서는 CDC 타임 오버스레시홀드 정보를 추가 사용해 배경 억제 효과가 나타났다. 또한, 단일 추론 단계에서 전체 트랙을 동시에 찾음으로써 중복 트랙 생성과 잘못된 히트 연결을 최소화해 순도 향상에 기여한다.
이 접근법은 Belle II와 같은 복합 검출기에서 전통적인 단계별 트랙 찾이 갖는 구조적 비효율성을 해소하고, 고루밀도 환경(예: 고광도 슈퍼KEKB)에서도 안정적인 트랙 재구성을 가능하게 한다. 향후 고전압 데이터 스트리밍, 실시간 트리거 적용, 그리고 다른 실험(예: LHCb, Mu3e)으로의 확장 가능성도 기대된다.
댓글 및 학술 토론
Loading comments...
의견 남기기