머신러닝으로 파악하는 전단 입자 전단계의 마찰 상태
초록
본 연구는 이산요소법(DEM) 시뮬레이션으로 만든 전단 입자층에서 개별 입자의 속도 신호를 통계적으로 특징화하고, XGBoost 기반 머신러닝 모델을 이용해 전역 마찰계수를 실시간으로 추정한다. 중위값·4차 모멘트와 같은 고차 통계량이 가장 중요한 예측 변수이며, 여러 입자의 정보를 결합하면 예측 정확도가 크게 향상된다.
상세 분석
이 논문은 지진 발생 메커니즘을 입자 수준에서 이해하기 위해, 밀집된 입자군을 전단시킨 DEM(Discrete Element Method) 시뮬레이션을 수행하였다. 시뮬레이션은 11 × 1.5 × 0.8 mm³ 크기의 영역에 7 996개의 구형 입자를 90–150 µm 크기 분포로 배치하고, 상하에 마찰계수 0.9인 거친 플레이트를 두어 10 MPa의 정압 하에 600 µm/s 속도로 전단하였다. 시간 스텝은 15 ns이며, 관성수는 10⁻³ 이하로 유지해 준정역 흐름을 보장한다.
데이터 전처리 단계에서는 각 입자의 3차원 속도(Vx, Vy, Vz)와 그 크기(V)를 10 스텝(≈1.5 × 10⁻⁷ s) 길이의 이동 윈도우로 나누어, 평균, 중앙값, 퍼센타일, 사분위 범위, 2차·3차·4차 모멘트 등 30여 개의 사전 정의된 통계 특징을 추출하였다. 특징들은 9 스텝씩 겹치며, 최종 모델 입력을 위해 30 스텝에 걸쳐 평활화하였다.
예측 모델은 XGBoost(Extreme Gradient Boosting) 기반의 Gradient Boosted Decision Trees를 사용했으며, 손실 함수는 평균제곱오차(L2)를 채택했다. 학습 데이터는 전체 시뮬레이션의 80%를, 테스트 데이터는 나머지 20%를 사용하였다. 모델은 입력 특징을 통해 전역 마찰계수(시뮬레이션에서 직접 계산된 값)를 회귀적으로 추정한다.
특징 중요도 분석에는 SHAP(Shapley Additive Explanations) 값을 적용하였다. SHAP는 게임 이론의 샤플리 값을 기반으로 각 특징이 예측에 기여한 정도를 정량화한다. 결과적으로 Vx의 중앙값과 전체 속도 V의 4차 모멘트가 가장 큰 SHAP 값을 보였으며, 이는 중앙값이 이상치에 강인한 전반적 추세를, 4차 모멘트가 꼬리 부분의 극단값(슬립 이벤트)을 감지한다는 물리적 해석과 일치한다. 또한 Vy의 4차 모멘트도 중요한 변수로 나타나, 전단 방향 외에 압축 방향에서도 입자 재배열이 마찰 상태에 영향을 미침을 시사한다.
단일 입자 모델의 최고 R²는 0.57로, 전체 입자 중 약 10%만이 유의미한 정보를 제공한다. 입자별 R² 분포는 중앙값 0.09, 90번째 백분위수 0.30을 보이며, 대부분의 입자는 전역 마찰 변화를 감지하지 못한다는 점을 드러낸다. 그러나 두 번째 입자의 특징을 추가하면 테스트 R²가 0.70까지 상승한다. 이는 서로 다른 위치의 입자가 서로 보완적인 정보를 제공함을 의미한다. 다만, 모든 입자를 무작위로 결합하면 오히려 과적합이나 특징 불일치로 성능이 저하될 수 있다.
이 연구는 (1) 입자 수준의 고속 속도 데이터가 전역 마찰 상태를 예측할 수 있는 충분한 정보를 담고 있음을, (2) 고차 통계량, 특히 중앙값과 4차 모멘트가 물리적으로 의미 있는 신호임을, (3) 여러 입자의 정보를 적절히 결합하면 예측 정확도가 크게 향상된다는 점을 입증한다. 이러한 결과는 실험실 마이크로진동 데이터나 지표 GPS 속도 변동과 같은 관측 데이터에 머신러닝을 적용해 지진 전조를 탐지하거나, 대규모 단층의 마찰 상태를 실시간 모니터링하는 새로운 방법론을 제시한다.
댓글 및 학술 토론
Loading comments...
의견 남기기