플라즈마 난류 예측과 파라미터 추정을 위한 FI‑Conv: 고성능 컨볼루션 연산자 네트워크
초록
FI‑Conv는 U‑Net 구조에 ConvNeXt V2 블록을 결합한 신경망으로, 초기 상태·PDE 파라미터·시간을 입력으로 받아 Hasegawa‑Wakatani 방정식 기반 플라즈마 난류의 단기·장기 전진 예측과, 가중치 업데이트 없이 자동 미분을 이용한 역문제 파라미터 추정을 동시에 수행한다. 실험 결과, t≈3까지는 정확한 전진 예측, t≈100까지는 통계적 특성 보존, 그리고 4가지 물리 파라미터를 효율적으로 복원함을 보였다.
상세 분석
FI‑Conv는 기존 U‑Net의 인코더 단계에 ConvNeXt V2 블록을 도입함으로써, 고주파 변동을 보존하면서도 파라미터 수와 연산량을 크게 줄였다. ConvNeXt V2는 깊은 스테이지에서 7×7 커널을 사용해 전역적인 공간 정보를 효과적으로 포착하고, 레이어 정규화와 GELU 활성화로 학습 안정성을 높인다. 입력 레이어에서는 초기 전장, PDE 파라미터(c₁, k₀, κ, c_pb)와 목표 시간 t를 “보틀넥 인젝션” 방식으로 결합하고, 하드 초기조건 제약을 통해 물리적 경계조건을 정확히 만족하도록 설계했다. 이러한 설계는 자동 미분을 통한 파라미터에 대한 미분 가능성을 보장해, 역문제에서 별도의 가중치 재학습 없이 gradient‑descent 기반 최적화가 가능하도록 만든다.
전진 예측은 자동 회귀(autoregressive) 방식으로 수행된다. FI‑Conv는 한 스텝(t) 예측을 마친 뒤, 그 출력을 다음 스텝의 초기조건으로 재투입해 장기 롤아웃을 구현한다. 128×128 격자와 4단계 다운샘플링·업샘플링 구조는 최종 8×8 잠재 공간을 제공하며, 여기서 7×7 커널이 전체 도메인 정보를 통합한다. 경계조건에 따라 zero, circular, reflective 패딩을 선택해 물리적 일관성을 유지한다.
실험에서는 Hasegawa‑Wakatani(HW) 방정식의 4가지 파라미터를 다양하게 변동시켜 320개의 시뮬레이션 데이터를 구축하였다. FI‑Conv는 t≈3까지는 평균 제곱오차(MSE) 기준으로 기존 FNO, 자동인코더, RNN 기반 모델보다 우수한 정확도를 보였으며, t≈100까지는 입자 플럭스(Γ_n)와 저항 손실(Γ_c) 같은 파생 물리량의 통계적 분포를 잘 재현했다. 역문제에서는 초기 상태와 관측된 최종 상태만을 이용해 파라미터를 추정했으며, 가중치 고정 상태에서 파라미터에 대한 손실 함수의 그래디언트를 계산해 수렴하였다. 추정된 파라미터는 실제 값과 평균 절대오차가 5% 이하로, 기존 베이지안 신경 연산자 방식보다 빠른 수렴 속도를 보였다.
FI‑Conv의 장점은 (1) 단일 모델로 전진·역문제를 동시에 처리, (2) 파라미터를 입력으로 직접 주입해 다중 물리 시나리오에 대한 일반화 능력, (3) ConvNeXt V2 기반 경량화 설계로 GPU 메모리와 연산 비용 절감이다. 한계점으로는 매우 긴 시간 롤아웃(t≫100)에서 누적 오차가 증가하고, 하드 경계조건 적용이 복잡한 비정형 도메인에선 추가적인 설계가 필요하다는 점이다. 또한, 현재는 2D 평면에 국한된 HW 모델에만 검증되었으며, 3D 전자기 플라즈마나 비선형 파동 방정식에 대한 확장 검증이 요구된다.
댓글 및 학술 토론
Loading comments...
의견 남기기