신경형 미분방정식과 기호 회귀를 활용한 동역학 시스템 탐구
초록
본 연구는 잡음이 섞인 합성 데이터로 구성된 두 개의 감쇠 진동 시스템을 대상으로, Neural Ordinary Differential Equations(NODE)와 Symbolic Regression(SR)의 외삽·내삽 능력과 물리 법칙 회복 가능성을 평가한다. NODE는 훈련 데이터와 동역학적 유사성을 공유하는 새로운 초기 조건에 대해 효과적으로 외삽할 수 있음을 확인했으며, SR은 입력 변수 선택에 따라 노이즈가 있는 데이터에서도 근본 방정식을 복원한다. 특히, 전체 시뮬레이션의 10 %만으로 학습된 NODE가 생성한 풍부한 데이터로 SR을 수행했을 때, 세 개 중 두 개의 정확한 방정식을 회복하고 나머지 하나는 근사적으로 찾는 결과가 도출되었다. 이는 제한된 실험 데이터 환경에서 NODE를 데이터 증강 도구로 활용해 물리 법칙을 자동 발견하는 새로운 파이프라인의 가능성을 시사한다.
상세 분석
본 논문은 두 개의 대표적인 감쇠 진동 시스템, 즉 물리학에서 널리 사용되는 카트‑폴 시스템과 영양 변화에 따른 세균 적응을 모델링한 생물학적 Bio‑model을 선택해 실험 설계를 전개한다. 각각의 시스템은 2차 미분 방정식 형태의 비선형 동역학을 가지고 있으며, 시뮬레이션 과정에서 0.5 %~5 % 수준의 균등 잡음을 인위적으로 추가함으로써 실제 실험 데이터와 유사한 조건을 재현한다.
NODE의 설계와 학습
- JAX 기반 Diffrax 라이브러리를 활용해 연속시간 신경망을 구현하였다.
- 카트‑폴에서는 초기 각도와 각속도의 조합 35가지(모델 A)와 특정 영역(모델 B)에서 각각 26개·25 Hz 샘플링 데이터를 사용해 학습하였다.
- Bio‑model에서는 12개의 영양 전이 시나리오(6 up‑shift, 6 down‑shift)를 대상으로, 시간당 10 포인트(첫 2 시간) 정도의 매우 희소한 데이터만을 이용해 NODE를 훈련시켰다.
실험 결과, NODE는 훈련 데이터와 동일한 위상 궤적을 공유하는 초기 조건에 대해 MSE가 낮은 ‘동적 유사성’ 영역을 형성한다는 점을 발견했다. 이는 전통적인 ‘초기 조건 수’를 늘리는 전략보다, 다양한 동역학 패턴을 포괄하도록 훈련 데이터를 설계하는 것이 외삽 성능을 크게 향상시킨다는 실용적 교훈을 제공한다. 또한, 샘플링 빈도가 낮아도(시간당 5~6 포인트) 장기 예측(8 시간)에서는 MSE 차이가 거의 없으며, 이는 NODE가 내부적으로 연속적인 흐름을 학습해 데이터 간격에 크게 민감하지 않음을 의미한다.
Symbolic Regression(SR) 분석
- PySR을 이용해 후보 함수 공간을 탐색했으며, 입력 변수로는 기본 상태 변수(θ, ω 또는 ψ_A, φ_R, χ_R)와 추가 파라미터 λ을 포함시켰다.
- 잡음이 없는 ‘ground‑truth’ 데이터에서는 λ을 포함했을 때 세 개의 목표 방정식 모두를 정확히 복원했다. 그러나 5 % 잡음이 가해진 경우, 특히 λ·ψ_A와 같은 작은 신호 항을 포함한 방정식(Equation 2)은 구조가 크게 단순화되거나 완전히 놓치게 된다. 이는 노이즈가 신호‑대‑노이즈 비율을 낮추어 미세 항을 감지하기 어렵게 만든다.
NODE‑보강 SR 파이프라인
- 전체 시뮬레이션 데이터의 10 %만으로 학습된 NODE를 이용해 고해상도 시뮬레이션 데이터를 생성한 뒤, 이를 SR에 투입하였다.
- 결과적으로 두 개의 방정식(Equation 3, 4)은 정확히 회복되었으며, Equation 2는 상수항은 근사했지만 구조적 형태는 부분적으로만 재현되었다. 흥미롭게도, NODE가 잡음을 어느 정도 억제하는 ‘디노이징’ 효과를 보여, 원본 잡음 데이터보다 SR 성능이 향상된 점이 관찰되었다.
제한점 및 향후 과제
- 현재 SR은 단일 전이 시뮬레이션에 국한돼 있어, 다중 조건·다중 전이 데이터를 동시에 학습하도록 확장할 필요가 있다.
- NODE의 학습 데이터가 최적화되지 않아, 더 복잡한 아키텍처(Neural CDE, SINDy와의 하이브리드 등)를 도입하면 일반화 능력이 개선될 가능성이 있다.
- 물리적 사전지식(단위 일치, 보존 법칙 등)을 SR 탐색에 통합하면 작은 신호 항을 더 잘 포착할 수 있을 것으로 기대된다.
요약하면, NODE는 동적 유사성을 기반으로 제한된 데이터에서도 강력한 외삽 능력을 보이며, SR은 적절한 입력 변수와 잡음 관리 하에 물리 방정식을 자동으로 복원한다. 두 기법을 결합한 데이터 증강 파이프라인은 실험 데이터가 부족한 과학 분야에서 물리 법칙을 발견하는 새로운 도구로서 큰 잠재력을 가진다.
댓글 및 학술 토론
Loading comments...
의견 남기기