다야베이 중성미자 실험에서 딥러닝으로 물리학 통찰 얻기

본 논문은 다야베이 원자로 중성미자 실험에서 수집된 8×24 형태의 PMT 전하 이미지 데이터를 딥 컨볼루션 신경망(CNN)과 컨볼루션 오토인코더로 학습시켜, 고차원 특성을 저차원 벡터로 압축하고 시각화하였다. 지도학습 CNN은 97 % 이상의 정확도로 ‘뮤온’, ‘플래셔’, ‘IBD 프롬프트’, ‘IBD 딜레이’, ‘기타’ 다섯 클래스를 구분했으며, t‑SNE 시각화는 물리적 이벤트 간의 구조적 구분을 명확히 드러냈다. 비지도학습 오토인코더 …

저자: Evan Racah, Seyoon Ko, Peter Sadowski

다야베이 중성미자 실험에서 딥러닝으로 물리학 통찰 얻기
다야베이 원자로 중성미자 실험은 192개의 광전증배관(PMT)으로 구성된 원통형 검출기를 이용해 항중성미자를 측정한다. 각 이벤트는 8 × 24 형태의 전하 강도 행렬로 기록되며, 물리학자들은 ‘뮤온’, ‘플래셔’, ‘IBD 프롬프트’, ‘IBD 딜레이’, ‘기타’ 등 다섯 가지 라벨을 사후 분석을 통해 부여한다. 기존 분석은 전하값 외에도 이벤트 간 시간 차이, 외부 검출기와의 연관성 등 다양한 파라미터를 활용해 복합적인 선택 기준을 적용한다. 그러나 이러한 전통적 방법은 라벨링에 의존하고, 새로운 이상 현상을 자동으로 탐지하기 어렵다는 한계가 있다. 본 연구는 이러한 문제점을 해결하고자, 원시 전하 이미지 데이터를 직접 입력으로 사용하는 딥러닝 파이프라인을 설계했다. 전처리 단계에서 모든 전하값에 자연 로그 변환을 적용하고, 값 범위를 0~1 사이로 정규화하였다. 또한, 원통형 배열의 경계 효과를 최소화하기 위해 열을 순환시켜 가장 큰 전하값이 중앙 열에 위치하도록 하였다. 이렇게 전처리된 데이터는 두 가지 신경망 구조에 투입된다. 첫 번째 구조는 지도학습 컨볼루션 신경망(CNN)이다. 네트워크는 5 × 5와 3 × 3 커널을 각각 16개씩 적용한 두 개의 컨볼루션 층과 2 × 2 맥스 풀링 층을 거쳐, 전결합(fully‑connected) 층에서 26차원 특징 벡터를 출력한다. 최종 소프트맥스 레이어는 다섯 클래스에 대한 확률을 제공한다. 학습에는 45 000개의 균형 잡힌 샘플을 사용했으며, 교차 엔트로피 손실과 확률적 경사 하강법(SGD)으로 최적화하였다. 테스트 결과, CNN은 전체 정확도 97.7 %를 달성했고, 특히 ‘IBD 프롬프트’와 ‘플래셔’ 클래스에서 기존 k‑NN(0.891, 0.951)과 SVM(0.966, 0.947)보다 높은 F1‑score와 정확도를 기록하였다. t‑SNE를 이용해 26차원 특징을 2차원으로 시각화한 결과, 서로 다른 이벤트가 명확히 구분된 군집을 형성했으며, 같은 군집 내에서도 전하 패턴이 유사함을 확인할 수 있었다. 이는 CNN이 전하 분포의 공간적 패턴을 효과적으로 학습했음을 의미한다. 두 번째 구조는 비지도학습 컨볼루션 오토인코더이다. 인코더는 두 차례의 컨볼루션·맥스 풀링을 통해 입력을 10차원 잠재벡터로 압축하고, 디코더는 전치 컨볼루션(transposed convolution)으로 원본 8 × 24 이미지를 재구성한다. 손실 함수는 평균 제곱 오차이며, 학습률 0.0005와 모멘텀을 사용하였다. 오토인코더는 라벨이 없는 상태에서도 데이터의 내재 구조를 포착하여, t‑SNE 시각화에서 뚜렷한 군집을 형성했다. 특히 한 군집은 ‘플래셔’와 유사한 전하 패턴을 보이는 이벤트들을 모아, 물리학자가 사전에 정의하지 않은 이상 현상을 자동으로 탐지할 가능성을 보여준다. 재구성 이미지와 원본 이미지의 차이를 통해 오토인코더가 학습한 특징의 표현력을 정량적으로 평가했으며, 재구성 품질이 높은 경우 잠재벡터가 데이터의 핵심 정보를 충분히 압축했음을 확인하였다. 이러한 결과는 딥러닝이 고차원 물리 데이터의 패턴을 자동으로 학습하고, 기존 물리 기반 선택 기준을 보완하거나 대체할 수 있음을 시사한다. 특히, 지도학습 CNN은 라벨이 있는 경우 최고의 분류 성능을 제공하고, 비지도 학습 오토인코더는 라벨이 없는 대규모 데이터에서도 의미 있는 군집을 형성함으로써 새로운 물리 현상을 탐지할 수 있는 가능성을 열어준다. 또한, t‑SNE와 같은 차원 축소 기법을 결합함으로써 물리학자들이 직관적으로 데이터 구조를 파악하고, 이상 이벤트를 시각적으로 확인할 수 있는 유용한 도구를 제공한다. 향후 연구 방향으로는 (1) 시간 정보와 외부 검출기 데이터를 포함한 멀티모달 딥러닝 모델 구축, (2) 시뮬레이션 데이터와 실제 데이터를 교차 검증하기 위한 생성적 적대 신경망(GAN) 활용, (3) 실시간 이벤트 필터링을 위한 경량화된 모델 설계 등이 제시된다. 이러한 확장은 다야베이 실험뿐만 아니라 다른 고에너지 물리 실험에서도 데이터 분석 효율성을 크게 향상시킬 것으로 기대된다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기