딥 소재 네트워크와 인터랙션 기반 네트워크의 성능 종합 평가: 다중 규모 물성 모델링을 위한 실험적 분석
초록
본 논문은 딥 소재 네트워크(DMN)와 회전‑프리 인터랙션 기반 소재 네트워크(IMN)의 오프라인 학습·온라인 예측 파이프라인 전반을 체계적으로 평가한다. 초기화, 배치 크기, 학습 데이터 양, 활성화 정규화 등 학습 하이퍼파라미터가 모델의 정확도와 변동성에 미치는 영향을 실험적으로 규명하고, IMN이 기존 DMN 대비 3.4~4.7배 빠른 오프라인 학습 속도를 보이면서도 예측 정확도와 계산 효율성은 동등함을 입증한다.
상세 분석
이 연구는 구조 보존형 기계학습 모델인 DMN과 그 변형인 IMN을 동일한 실험 설계 하에 비교함으로써, 두 모델이 실제 엔지니어링 워크플로우에 적용될 때 발생할 수 있는 위험 요소와 장점을 정량화한다. 먼저, 학습 초기화 방식이 가중치와 회전 파라미터의 탐색 공간에 미치는 영향을 조사하였다. 무작위 초기화와 사전 학습된 파라미터 기반 초기화 모두 수렴 속도와 최종 손실에 차이를 보였으며, 특히 사전 초기화가 배치 크기가 작을 때 과적합을 억제하고 변동성을 감소시키는 것으로 나타났다. 배치 크기 실험에서는 소규모 배치(≤32)가 학습 진동을 크게 유발해 최적화 과정이 불안정해지는 반면, 중대형 배치(≥128)는 GPU 메모리 효율성을 유지하면서도 손실 감소율을 높였다. 학습 데이터 규모는 예측 오차와 분산 모두에 직접적인 영향을 미쳤으며, 데이터 포인트가 10배 증가할 때 평균 상대 오차가 약 30% 감소하고, 표준편차는 40% 이상 감소하였다. 이는 DMN/IMN이 물리 기반 구조를 내포하고 있음에도 불구하고, 충분한 선형 탄성 샘플이 제공될 경우 비선형 비탄성 거동을 정확히 외삽할 수 있음을 시사한다.
활성화 정규화(η, ξ)의 역할도 상세히 분석하였다. 정규화 강도를 높이면 활성화된 베이스 노드 수가 제한되어 네트워크 복잡도가 감소하고, 결과적으로 온라인 단계에서의 반복 횟수와 연산량이 감소한다. 그러나 과도한 정규화는 모델 표현력을 억제해 복잡한 마이크로구조를 충분히 포착하지 못하고, 특히 강한 비선형 경로(예: 플라스틱 변형)에서 예측 편향이 발생한다. 최적의 정규화 파라미터는 오프라인 손실과 온라인 수렴 속도 사이의 트레이드오프를 균형 있게 맞추는 지점으로, 본 논문에서는 η≈1e‑4, ξ≈0.1이 대부분의 테스트 케이스에서 최적임을 제시한다.
IMN은 회전 파라미터를 직접 최적화하지 않고, 상호작용 기반 매개변수화로 대체함으로써 파라미터 수를 30% 이상 절감한다. 실험 결과, 동일한 네트워크 깊이(N=4)에서 IMN은 학습 시간당 3.4~4.7배의 속도 향상을 보였으며, 온라인 예측 정확도(RMSE)와 계산 비용(플롭스)에서도 DMN과 통계적으로 유의미한 차이가 없었다. 이는 회전 자유도를 제거해도 마이크로구조의 기하학적·물성적 정보를 충분히 전달할 수 있음을 의미한다.
마지막으로, 온라인 단계에서 두 가지 솔버(고정점 반복 vs. 뉴턴-라프슨)와의 결합 성능을 비교했다. 고정점 반복은 구현이 간단하고 메모리 요구가 낮지만 수렴 속도가 느려 복합 재료의 강한 비선형성에서는 1015번의 반복이 필요했다. 반면 뉴턴-라프슨은 초기 잔차가 작을 때 35번의 반복으로 수렴했으며, 전체 시뮬레이션 시간은 약 30% 단축되었다. 그러나 뉴턴 방법은 헤시안 근사와 라인 서치 비용이 추가되므로, 작은 배치·단계에서는 고정점이 더 효율적일 수 있다.
전반적으로, 본 연구는 DMN/IMN이 구조 보존형 머신러닝 모델로서 높은 일반화 능력과 계산 효율성을 동시에 제공함을 실증하고, 학습 파라미터 선택, 정규화 강도, 솔버 전략 등 실무 적용 시 고려해야 할 구체적인 가이드라인을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기