메시그래프넷‑트랜스포머: 고해상도 고체역학 시뮬레이션을 위한 스케일러블 그래프 기반 학습 모델
초록
본 논문은 MeshGraphNet‑Transformer(MGN‑T)라는 새로운 신경망 구조를 제안한다. 기존 MeshGraphNet의 지역적 메시지 패싱 한계를 극복하기 위해 전역 물리‑Attention 트랜스포머를 도입하고, 전·후처리 MPNN 블록으로 로컬 기하학적 정보를 보존한다. 이를 통해 산업 수준의 고해상도 메쉬(수만 개 노드)에서도 충돌·자체접촉·소성 등 복잡한 비선형 현상을 정확히 예측하며, 파라미터 효율성까지 확보한다.
상세 분석
MGN‑T는 그래프‑신경망(GNN)과 트랜스포머의 장점을 결합한 하이브리드 아키텍처이다. 입력은 FEM 기반 메쉬를 그대로 그래프(V, E) 형태로 표현하며, 노드에는 물리량(속도, 두께 등)과 타입을, 엣지에는 참조·현재 좌표 차이와 접촉 정보를 인코딩한다. 기존 MeshGraphNet은 순차적인 메시지 패싱을 통해 2‑hop 정도까지만 정보를 전파할 수 있어, 대규모 메쉬에서는 ‘under‑reaching’ 문제가 발생한다. 이를 해결하기 위해 MGN‑T는 (1) 프리‑프로세서 MPNN으로 2‑hop 로컬 정보를 미리 집계하고, (2) Physics‑Attention 트랜스포머를 전역 프로세서로 사용한다. 트랜스포머는 모든 노드를 동시에 업데이트하지만, 직접적인 N² 연산을 피하기 위해 eidetic token slicing 기법을 적용한다. 즉, N개의 노드 특징을 P(≪N)개의 물리 토큰으로 투사하고, 토큰 간 self‑attention을 수행한 뒤 역투사한다. 온도 파라미터 τ와 Gumbel‑Softmax를 이용한 가중치 샘플링으로 토큰 간 연결 강도를 동적으로 조절해, 급격한 변형이나 접촉 영역에서도 높은 표현력을 유지한다. 마지막으로 리파인먼트 MPNN이 다시 두 번의 메시지 패싱을 수행해 로컬 일관성을 보강한다.
학습은 1‑step teacher‑forcing 방식으로 MSE 손실을 최소화하며, 배치 내 샘플은 동일 시뮬레이션의 연속 프레임이어야 트랜스포머 입력 형태가 맞는다. 실험은 두 가지 베치마크(고속 충돌을 다룬 Pi‑beam, 정적 변형을 다룬 Deforming plate)에서 수행되었다. Pi‑beam은 16 k 노드, 9개의 서로 다른 두께·재질 컴포넌트, 강체와의 접촉을 포함한 실제 자동차 충돌 시나리오이며, Deforming plate는 1.2 k 노드 규모의 정적 변형 문제다.
성능 측면에서 MGN‑T는 기존 MeshGraphNet, BSMS‑GNN, ReGUNet 등과 비교해 MAE와 RMSE가 30 % 이상 감소하고, 파라미터 수는 5 % 수준으로 크게 절감한다. 특히 고해상도 메쉬에서 트랜스포머 기반 전역 업데이트가 한 번에 장거리 상호작용을 포착함으로써, 깊은 메시지 패싱이 필요 없으며, 메모리·시간 복잡도도 P²에 비례해 실용적인 수준을 유지한다. 또한, 자체접촉·소성 변수(플라스틱 변형률, 내부 응력 등)까지 다중 출력 형태로 학습 가능해, 설계 단계에서 바로 활용할 수 있다.
한계점으로는 토큰 수 P를 어떻게 최적화할지에 대한 가이드라인이 부족하고, 매우 불규칙한 메쉬(예: 비구조적 포인트 클라우드)에서는 토큰 투사 과정이 추가적인 전처리를 요구한다는 점이다. 또한, 현재는 물리‑Attention이 순수히 데이터‑드리븐이며, 물리 법칙(에너지 보존 등)을 직접 제약하는 손실은 포함되지 않아, 장기 롤아웃 시 누적 오차가 발생할 가능성이 있다. 향후 연구에서는 물리 기반 정규화와 토큰 동적 조정 메커니즘을 결합해 더욱 견고한 시뮬레이터를 만들 수 있을 것이다.
댓글 및 학술 토론
Loading comments...
의견 남기기