FPGA 기반 초고속 의사결정 트리 자동인코더로 탐색하는 새로운 힉스 붕괴
초록
본 논문은 표준 모델 데이터를 학습한 의사결정 트리(Decision‑Tree) 기반 자동인코더를 FPGA에 구현해 30 ns의 초저지연으로 이상 탐지를 수행한다. LHC 트리거 시스템에 적용해 희귀한 외부 힉스 붕괴 신호를 실시간으로 검출하고, 자원 사용량을 퍼센트 수준으로 억제한다.
상세 분석
이 연구는 기존의 신경망 기반 자동인코더가 FPGA에 구현될 때 수백 나노초에서 수 마이크로초 수준의 지연을 보이는 한계를 극복하고자, “깊은 의사결정 트리(Deep Decision Tree, DDT)”를 활용한 새로운 자동인코더 구조를 제안한다. 핵심 아이디어는 입력 벡터 x 를 다수의 트리로 구성된 포레스트에 통과시켜 각 트리에서 얻은 이진 인덱스 b (또는 B‑bit 정수)를 잠재공간 w 으로 사용하고, 동일한 포레스트를 역으로 적용해 ^x 를 재구성하는 것이다. 트리의 분할 기준은 입력 변수의 주변 확률밀도함수(PDF)를 샘플링해 얻은 임계값 c 이며, 이는 “가중 무작위” 방식을 통해 트리마다 서로 다른 변수와 임계값을 선택하게 함으로써 포레스트 전체의 다양성을 확보한다.
학습 단계에서는 표준 모델(SM) 이벤트를 이용해 각 트리의 분할 규칙을 최적화한다. 구체적으로, (1) 전체 샘플 S 에서 가장 높은 빈도(PDF 최대값)를 갖는 변수 x̃ᵥ 를 선택하고, (2) 해당 변수의 PDF에서 임계값 ĉ 을 샘플링해 x̃ᵥ < ĉ 인 서브샘플과 그렇지 않은 서브샘플로 재귀적으로 분할한다. 재귀 깊이는 최대 D (논문에서는 D=4)로 제한하고, 최소 샘플 비율 f (예: 0.01) 이하가 되면 분할을 중단한다. 이렇게 구성된 “Decision Tree Grid(DTG)”는 각 트리마다 서로 다른 분할 경로를 갖게 되며, 전체 포레스트는 7~8개의 트리로 구성된다.
재구성 손실은 각 트리별 L₁ 거리(입력과 재구성된 출력의 절대 차)들의 합 Δ(x) 으로 정의된다. SM 이벤트는 학습된 트리 구조와 잘 맞아 작은 Δ 값을 보이며, BSM(비표준 모델) 이벤트는 트리 분할과 불일치해 큰 Δ 값을 만든다. 따라서 Δ 값을 임계값으로 삼아 실시간 이상 탐지기를 구현한다.
FPGA 구현 측면에서 저자들은 Xilinx Virtex UltraScale+ VU9P를 사용해 전체 포레스트를 파이프라인화하고, 각 트리의 비교 연산을 완전 병렬화했다. 트리 깊이 D=4 와 트리 수 T≈8 을 기준으로, 논문은 30 ns(≈1 클럭 사이클당 2 ns) 내에 전체 인코딩·디코딩·스코어링을 완료함을 입증한다. 리소스 사용량은 LUT ≈ 2 %, BRAM ≈ 1 % 수준으로, 기존 신경망 기반 자동인코더(80–480 ns, 10–30 % 리소스) 대비 크게 효율적이다.
물리학 적용 사례로는 힉스 붕괴 H → aa → γγ jj (가벼운 의사스칼라 a 질량 10 GeV와 70 GeV)와, 대체 질량 70 GeV 히그스‑유사 스칼라 H₇₀ → aa → γγ jj 시나리오를 선택했다. 시뮬레이션은 MadGraph5_aMC@NLO와 Pythia8, Delphes를 이용해 13 TeV pp 충돌을 재현했으며, 입력 변수는 두 광자와 두 제트의 p_T, ΔR, m_γγ, m_jj 총 8개이다. 자동인코더는 SM 배경에 대해 Δ 분포가 좁고 평균이 작으며, 신호에 대해서는 평균 Δ 값이 크게 차이 나서 90 % 이상의 신호 효율을 유지하면서 배경 억제율을 70 % 이상 달성한다. 또한, 훈련 데이터에 5 % 수준의 신호 혼합이 포함돼도 성능 저하가 미미함을 보여, “오염된 훈련”에 대한 강인성을 입증한다.
마지막으로, 저자들은 동일한 물리 시나리오에 대해 기존 신경망 기반 자동인코더(정밀도 8‑bit, 120 ns 지연)와 비교했을 때, 트리 기반 모델이 지연·리소스·전력 효율성에서 우수함을 강조한다. 특히, 실시간 트리 비교 연산은 디지털 논리 수준에서 구현 가능하므로, 전력 소모가 수십 mW 수준에 그쳐 에지 AI 디바이스나 고에너지 물리 실험의 제한된 전력 환경에 적합하다.
요약하면, 이 논문은 “깊은 의사결정 트리 자동인코더”라는 새로운 알고리즘을 제시하고, 이를 FPGA에 최적화해 30 ns 초저지연으로 LHC 트리거에 적용함으로써 희귀 BSM 힉스 붕괴 탐지를 실시간으로 가능하게 만든다.
댓글 및 학술 토론
Loading comments...
의견 남기기