경량 EfficientNet 기반 톱 제트 태깅, 성능과 비용의 균형
초록
본 논문은 고해상도 이미지와 전역 물리량을 결합한 경량 EfficientNet 변형을 이용해, 대규모 GPU 자원 없이도 탑-쿼크 제트를 효과적으로 구분할 수 있음을 보인다. 기존 Transformer·GNN 기반 모델 대비 연산량은 크게 감소했으며, 전역 피처의 추가가 정확도 향상에 중요한 역할을 함을 확인하였다.
상세 분석
이 연구는 LHC 고에너지·고광도 환경에서 요구되는 실시간 혹은 대규모 오프라인 분석에 적합한, 계산 비용이 낮은 CNN 기반 제트 태거를 설계한다는 목표를 갖는다. 기존에 최고 성능을 보였던 Transformer와 Graph Neural Network(GNN) 모델들은 수백만 파라미터와 복잡한 메시지 패싱 구조로 인해 단일 GPU에서도 학습·추론 시간이 크게 늘어나는 단점이 있었다. 저자들은 이러한 문제점을 해결하기 위해 EfficientNet 아키텍처의 ‘compound scaling’ 원리를 차용하되, 이미지 해상도와 네트워크 깊이·폭을 크게 축소한 경량 버전을 구현한다.
데이터 전처리는 Pythia8로 생성한 14 TeV pp 충돌 이벤트를 Delphes 시뮬레이션을 통해 디텍터 수준까지 재현한 뒤, anti‑kT(R=0.8) 알고리즘으로 1 M개의 탑 제트와 1 M개의 비탑(라이트·글루온) 제트를 추출한다. 각 제트는 최대 200개의 구성 입자를 보유하며, 이들 입자의 p_T, 질량, 에너지를 채널별로 매핑해 35×35 혹은 40×40 픽셀의 3채널 이미지로 변환한다. 이미지 중심은 가장 높은 p_T 입자로 정하고, Δη–Δφ 평면에 균일하게 binning한다. 표준화(mean‑std)와 중앙 크롭(28×28, 32×32) 과정을 거쳐 배경 노이즈를 최소화한다.
전역 피처는 Jet four‑momentum(p_T, η, φ, m), 입자 수(N_cons), N‑subjettiness(τ_21, τ_32 등), Energy Correlation Functions(C, D, U, M, N, L 시리즈) 등 총 30여 개를 FastJet‑contrib를 이용해 계산한다. 이러한 피처는 이미지 기반 CNN에 별도의 전결합(FC) 레이어를 통해 결합되며, 실험적으로 전역 피처만 단독으로 사용했을 때도 일정 수준의 구분 능력을 보였지만, 이미지와 결합했을 때 정확도가 현저히 상승한다는 점을 확인하였다.
모델 아키텍처는 LeNet‑5를 베이스라인으로 삼아, EfficientNet‑S(소형)와 EfficientNet‑B0(중형) 두 가지 변형을 설계한다. 각 블록은 MBConv(Depthwise + Pointwise Convolution)와 Squeeze‑and‑Excitation(SE) 모듈을 포함해 파라미터 수를 0.5 M 이하로 유지한다. 입력 해상도에 따라 depth‑coefficient(α), width‑coefficient(β), resolution‑coefficient(γ)를 조정해 35×35와 40×40 두 스케일을 실험하였다. 학습은 Adam 옵티마이저와 cosine‑annealing 스케줄을 사용했으며, 배치 크기 256, 에포크 50으로 진행하였다.
성능 평가에서는 ROC‑AUC와 배경 억제율(1 % 신호 효율에서의 거부율) 등을 사용했다. 전역 피처를 포함한 EfficientNet‑S는 AUC ≈ 0.985, 1 % 효율에서 배경 억제율 ≈ 94 %를 달성했으며, 이는 동일 파라미터 규모의 LeNet(≈0.970, 85 %)보다 크게 우수했다. 또한, 기존 최첨단 Transformer(GNN) 모델과 비교했을 때 정확도 차이는 1–2 % 수준에 불과했지만, 추론 시간은 RTX A2000 기준 0.8 ms(35×35)에서 1.2 ms(40×40)로, 1080 Ti 기준 3–4배 빠른 것으로 보고되었다.
이러한 결과는 (1) 이미지 해상도를 크게 늘리지 않아도 EfficientNet‑style 경량 구조가 충분히 복잡한 제트 서브스트럭처를 학습할 수 있음을, (2) 전역 물리량이 이미지 기반 특징과 보완적인 정보를 제공해 모델 복잡도를 낮추면서도 정확도를 유지·향상시킬 수 있음을, (3) 실험실·현장 환경에서 GPU 자원이 제한된 상황에서도 실시간 태깅이 가능함을 시사한다. 향후 연구에서는 다중 클래스(예: W/Z, Higgs) 태깅, 도메인 적응(다른 디텍터 시뮬레이션) 및 양자화/프루닝을 통한 추가 경량화를 탐색할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기