지반공학에서 딥러닝: PINN과 연산자 학습의 비판적 평가
초록
본 논문은 물결 전파와 빔‑기초 상호작용이라는 전형적인 지반공학 문제에 대해 물리‑정보 신경망(PINN), 딥 연산자 네트워크(DeepONet), 그래프 네트워크 시뮬레이터(GNS)를 전통적인 유한차분 해법과 비교한다. 실험 결과 PINN은 전통 해법보다 9만 배 느리면서 오차가 크게 증가하고, DeepONet은 수천 번의 학습 시뮬레이션이 필요하며 수백만 번의 평가 후에야 비용 효율성을 보인다. GNS는 기하학에 독립적인 시뮬레이션에 잠재력이 있으나 규모 확장에 한계가 있고, 비선형 경로 의존성 토양 거동을 재현하지 못한다. 역문제에서는 전통 해법에 자동 미분을 적용하면 초단위 내에 재료 파라미터를 서브 퍼센트 수준으로 복원할 수 있다. 저자는 딥러닝 모델을 실제 적용하기 전에 정확도·속도·학습 범위 등을 면밀히 검증할 것을 권고한다.
상세 분석
이 연구는 지반공학 분야에서 최근 각광받고 있는 딥러닝 기반 물리 모델링 기법들을 체계적으로 검증한다. 첫 번째로 물리‑정보 신경망(PINN)은 미분 방정식 자체를 손실 함수에 직접 삽입해 학습한다는 이론적 장점에도 불구하고, 실제 구현에서는 수치적 불안정성과 경계 조건 처리의 복잡성으로 인해 계산 비용이 급격히 증가한다. 논문에서는 1‑D 파동 전파 문제를 기준으로 PINN이 동일한 격자와 시간 스텝을 사용하는 2차 정확도 유한차분(FD) 해법에 비해 약 90,000배 느리며, L2 오차가 2~3배 정도 크게 나타났음을 보고한다. 이는 PINN이 고차원 파라미터 공간을 탐색하면서 발생하는 최적화 난이도와, 자동 미분에 의한 연산 그래프가 메모리와 연산량을 크게 소모하기 때문이다. 또한, PINN은 훈련 데이터 범위를 벗어나는 외삽 상황에서 급격히 발산하는 경향을 보였으며, 이는 지반공학에서 현장 조건이 다양하고 불확실성이 큰 상황에 부적합함을 시사한다.
두 번째로 DeepONet은 입력 함수(예: 초기 변위·속도)를 고차원 연산자 맵핑으로 변환해 새로운 입력에 대해 빠르게 예측할 수 있다는 기대를 갖는다. 그러나 논문에서는 DeepONet이 충분한 일반화 능력을 확보하려면 수천 개의 고품질 시뮬레이션 데이터를 사전 생성해야 함을 강조한다. 학습 후에도 단일 평가당 약 1 ms 정도가 소요되며, 실제 현장 적용을 위해 수백만 번 이상의 반복 평가가 요구되는 경우에만 전통 해법 대비 비용 절감 효과가 나타난다. 특히, 학습 데이터에 포함되지 않은 파라미터 조합이나 비선형 경계 조건이 등장하면 예측 오차가 급격히 상승한다. 이는 연산자 학습이 “학습 영역 내”에서만 신뢰할 수 있음을 의미한다.
세 번째로 제안된 그래프 네트워크 시뮬레이터(GNS)는 입자 기반 또는 메쉬 자유 형태의 지오메트리를 처리할 수 있다는 점에서 매력적이다. 실험에서는 복합 기초 구조와 비정형 토양 레이어를 그래프 형태로 표현하고, 물리적 상호작용을 메시지 패싱으로 근사하였다. 결과적으로 GNS는 복잡한 기하학을 빠르게 재현했지만, 토양의 소성·경화·이력 의존성 같은 경로 의존적 거동을 모델링하는 데 한계가 있었다. 또한, 그래프 노드 수가 증가할수록 메모리 사용량과 연산 복잡도가 급격히 상승해, 대규모 현장 모델링에는 아직 실용적이지 않다.
역문제 해결 측면에서는 전통 유한요소(FE) 혹은 유한차분(FD) 해법에 자동 미분(AD)을 적용한 방법이 뛰어난 성능을 보였다. 파라미터(탄성계수·감쇠비·전단강성 등)를 미분 가능한 형태로 정의하고, 관측된 변위·응답 데이터와의 차이를 최소화하는 최적화 루프를 돌리면, 수초 내에 서브 퍼센트 수준의 정확도로 파라미터를 복원할 수 있었다. 이는 딥러닝 모델을 별도로 구축할 필요 없이 기존 검증된 해법을 그대로 활용하면서도 역문제에 대한 고효율 추정이 가능함을 보여준다.
종합적으로, 저자는 딥러닝 기반 모델이 “전통 해법 대비 4자리 수 느리면서 정확도는 낮다”는 경우에는 채택을 재고해야 한다고 강조한다. 특히, 학습 데이터 범위를 벗어나는 외삽 상황이 빈번하고, 경로 의존적 비선형 거동을 정확히 재현해야 하는 지반공학에서는 현재 수준의 딥러닝 기법이 실용적 대안이 되기 어렵다. 대신, 전통 해법에 자동 미분을 결합하거나, 학습 비용이 정당화되는 대규모 파라미터 스터디·확률적 위험 평가와 같은 특수 목적에 한정하여 신경망을 활용하는 것이 바람직하다.
댓글 및 학술 토론
Loading comments...
의견 남기기