TokaMark: MAST 플라즈마 모델링을 위한 종합 벤치마크
초록
본 논문은 영국 MAST 토카막 실험에서 수집된 실제 진단 데이터를 기반으로, 14개의 하위 과제를 포함한 통합 벤치마크인 TokaMark를 제안한다. 데이터 통합, 메타데이터 정규화, 시간 정렬 및 평가 프로토콜을 제공하며, 다중 모달·다중 레이트·노이즈가 섞인 플라즈마 데이터를 AI 모델이 일관되게 학습·평가할 수 있도록 설계되었다. 또한, 다중 브랜치 컨볼루션 인코더‑디코더 기반 베이스라인을 공개해 재현성을 확보한다.
상세 분석
TokaMark는 기존 fusion 데이터셋이 파편화되고 표준화가 부족한 문제를 해결하기 위해, FAIR 원칙에 입각한 데이터 패키징과 파이썬 API를 제공한다. 39개의 신호를 4가지 축(카테고리·출처·샘플링 주파수·모달리티)으로 정리한 신호 taxonomy는 모델 설계 시 입력 형태와 전처리 전략을 명확히 정의한다. 특히, magnetics, Thomson scattering, Mirnov 코일, NBI 파워 등 고주파·저주파·2D 프로파일·3D 비디오 등 다양한 모달리티를 동시에 다룰 수 있도록 멀티‑브랜치 구조를 채택했다.
과제 설계는 크게 네 그룹으로 나뉜다. 첫 번째는 이질적인 진단 데이터를 통합해 플라즈마의 잠재 표현을 학습하는 representation learning 과제이며, 두 번째는 빠른 MHD 반응부터 느린 전송 현상까지 다양한 시간 스케일을 포괄하는 temporal reasoning 과제이다. 세 번째는 센서 결함·데이터 누락 상황에서도 견고하게 동작하도록 설계된 robustness 과제이며, 네 번째는 서로 다른 운영 레짐(예: 전류·밀도·가열 조건) 간 일반화 능력을 평가한다.
입출력 윈도우 기반 설계는 실시간 제어와 예측 시나리오에 직접 매핑된다. 입력 윈도우는 과거 Δ_input 만큼의 진단·액추에이터 데이터를 포함하고, 출력 윈도우는 동일 구간의 재구성(reconstruction) 혹은 미래 Δ_output 만큼의 예측(forecasting)을 요구한다. 이를 통해 모델은 시계열 복원, 자기 회귀 예측, 그리고 파라미터 추정 등 다양한 목표를 동시에 학습할 수 있다.
평가 프로토콜은 계층적(metric hierarchy)으로 구성된다. 저수준에서는 RMSE, MAE, 스펙트럼 차이 등 신호별 오차를 측정하고, 고수준에서는 플라즈마 형태 재구성 정확도, MHD 이벤트 선행 지표 검출률, 제어 목표 달성률 등을 종합한다. 이러한 다층 평가 체계는 특화 모델과 범용(Foundation) 모델 모두를 공정하게 비교할 수 있게 한다.
베이스라인 모델은 다중 브랜치 1‑D/2‑D 컨볼루션 레이어와 시계열 어텐션을 결합한 구조이며, 각 과제별로 독립 학습한다. 실험 결과, 베이스라인은 대부분의 과제에서 10‑20% 수준의 성능 향상을 보였으며, 특히 데이터 결측 상황에서도 비교적 안정적인 복원 능력을 보여준다. 이는 향후 연구자들이 제시된 베이스라인을 출발점으로 더 복잡한 물리‑인식 모델(예: 물리‑인포드 뉴럴 네트워크, 그래프 신경망)이나 대규모 사전학습 모델을 개발하는 데 유용한 기준이 될 것이다.
전반적으로 TokaMark는 데이터 접근성, 과제 정의, 평가 기준을 일원화함으로써 AI‑for‑Science와 전통적인 물리 기반 시뮬레이션 사이의 격차를 메우는 중요한 인프라를 제공한다.
댓글 및 학술 토론
Loading comments...
의견 남기기