TokEye 빠른 신호 추출을 위한 오프라인 자기지도 학습

본 논문은 ITER와 같은 차세대 핵융합 장치에서 발생하는 방대한 다중 진단 데이터의 실시간 분석을 목표로, 오프라인 자기지도 학습 기반의 “signals‑first” 프레임워크인 TokEye를 제안한다. 고잡음·고차원 시간‑주파수 스펙트로그램에서 코히런트, 준코히런트, 트랜지언트 모드를 자동으로 구분·추출하고, 다채널 신호를 비선형 최적화와 경량 신경망 대리 모델을 결합해 0.5 초 이내의 추론 지연을 달성한다. DIII‑D, TJ‑II 및 …

저자: Nathaniel Chen, Kouroche Bouchiat, Peter Steiner

TokEye 빠른 신호 추출을 위한 오프라인 자기지도 학습
본 논문은 차세대 핵융합 장치 ITER가 매일 생성할 것으로 예상되는 페타바이트 규모의 다중 진단 데이터를 효율적으로 처리하기 위한 새로운 프레임워크 ‘TokEye’를 제안한다. 기존의 수동 분석 및 단일 센서에 특화된 필터뱅크 방식은 높은 잡음, 중첩된 트랜지언트 이벤트, 그리고 센서별 특수성을 고려하지 못한다는 한계가 있었다. 이를 극복하기 위해 저자들은 ‘signals‑first’ 자기지도 학습 접근법을 채택하고, 모든 진단 데이터를 동일한 시간‑주파수 표현(STFT)으로 변환한 뒤, 물리적 특성에 기반한 신호 분류 체계를 구축한다. 첫 단계는 신호 taxonomy를 정의하는 것으로, deterministic(주기적·비주기적)과 stochastic(확률적·비확률적) 과정을 물리적 현상에 매핑한다. 이를 통해 코히런트, 준코히런트, 트랜지언트, 브로드밴드, 노이즈의 다섯 가지 하위 클래스를 도출하고, 각각을 ‘코히런트 측정’, ‘브로드밴드 측정’, ‘노이즈’라는 상위 카테고리로 묶는다. 이러한 체계는 다양한 진단(자기장, ECE, CO₂ 인터페로미터, BES 등)에서 공통적으로 적용 가능하도록 설계되었다. 시간‑주파수 변환은 500 kHz로 재샘플링하고, 1024‑점 Hann 윈도우와 87.5 % 오버랩을 적용한 STFT를 사용한다. 복소 스펙트럼 Z(t,f)는 코히런트 성분 M(t,f), 브로드밴드 성분 V(t,f), 잡음 η(t,f)로 분해된다. 브로드밴드 성분을 추출하기 위해 비대칭 최소제곱(AsLS) 기반의 베이스라인 최적화 문제를 설정한다. 손실 함수는 잔차 제곱합과 2차 라플라시안 정규화 항을 포함하고, 양의 잔차에 높은 가중치(p≈0.001)를 부여해 피크를 보존한다. λ=10⁶의 정규화 파라미터는 실험적으로 최적화되었으며, 4 kHz 이하에서 발생하는 가장자리 효과를 최소화한다. 베이스라인을 추정·제거함으로써 스펙트럼은 ‘화이트닝’되어 브로드밴드 구조와 코히런트 모드가 명확히 구분된다. 화이트닝된 스펙트럼에서 코히런트 모드와 잡음을 분리하기 위해 다채널 교차 스펙트럼 기반의 비선형 최적화와 경량 CNN 대리 모델을 결합한 자기지도 학습 파이프라인을 설계한다. 자동 라벨링 모듈은 V(t,f)와 M(t,f)를 구분하고, 라벨 교정 단계에서 오류를 최소화한다. 학습된 모델은 각 진단 채널에 대해 0.5 초 이내의 추론 지연을 달성한다. 실험은 DIII‑D의 네 가지 대표 진단(ECE, CO₂, MHR, BES)과 TJ‑II 데이터를 사용했으며, 비핵융합 분야의 바이오음향 스펙트로그램에도 적용했다. TokEye는 기존 임계값 기반 방법에 비해 평균 30 dB 이상의 SNR 향상을 보였고, 특히 약한 알파 입자 유도 알베르트 모드(AE)와 짧은 ELM 스파이크를 정확히 검출했다. 바이오음향 실험에서는 새우 울음과 새소리 같은 트랜지언트 이벤트를 성공적으로 구분해, 프레임워크의 범용성을 입증했다. 코드와 데이터셋은 GitHub(https://github.com/PlasmaControl/TokEye)에서 공개돼, 재현 가능성과 커뮤니티 확장을 목표로 한다. 저자들은 향후 실시간 플라즈마 제어 루프에 TokEye를 직접 통합하고, 중성 입자 분석기, 레이저 인터페로미터 등 추가 진단으로 확장할 계획을 제시한다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기