2차원 다공성 매체 투과성 텐서 예측을 위한 딥러닝 모델 비교

초록

본 연구는 2차원 이진 이미지(고체 1, 공극 0)로부터 다공성 매체의 투과성 텐서를 예측하기 위해 합성 데이터 24 000개와 Lattice‑Boltzmann 시뮬레이션 기반 레이블을 활용하였다. ResNet‑50/101, Vision Transformer(T‑16/S‑16), ConvNeXt(Tiny/Small) 등 세 종류의 이미지‑기반 네트워크를 비교하고, 가중치 감쇠·학습률 스케줄링·데이터 증강 등 일반화 기법을 적용하였다. 데이터 증강과 데이터셋 규모 확대가 전반적인 정확도를 향상시켰으며, ConvNeXt‑Small가 테스트 4 000개 샘플에서 R² 0.99460으로 최고 성능을 보였다.

상세 요약

이 논문은 다공성 매체의 투과성 텐서 예측이라는 전통적으로 수치 시뮬레이션이나 실험에 의존하던 문제를 이미지‑기반 딥러닝으로 전환한다는 점에서 학문적·산업적 의의를 가진다. 데이터 생성 단계에서는 임의의 주기적 구조를 갖는 2차원 이진 이미지 24 000개를 제작했으며, 각 샘플은 지정된 공극률과 특징 길이 스케일을 갖도록 설계되었다. Lattice‑Boltzmann Method(LBM)를 이용해 각 이미지에 대한 흐름 해석을 수행함으로써 투과성 텐서(두 개의 주축 방향과 교차 성분)를 정밀하게 계산하였다. 이렇게 얻은 레이블은 10⁻⁶ ~ 10⁻³ 범위에 걸쳐 3 오더의 변동성을 보이며, 딥러닝 모델이 학습해야 할 목표값의 복잡성을 충분히 반영한다.

모델 구성에서는 ResNet‑50·101, Vision Transformer(ViT‑T16·ViT‑S16), ConvNeXt(Tiny·Small) 총 여섯 가지 아키텍처를 선택하였다. ResNet은 잔차 연결을 통한 깊은 컨볼루션 네트워크이며, ViT는 패치 임베딩 후 다중 헤드 셀프‑어텐션을 적용하는 트랜스포머 기반 구조다. ConvNeXt는 최신 컨볼루션 설계 원칙을 반영한 네트워크로, 레이어 정규화·점진적 확장·스케일링 전략을 채택한다. 모든 모델은 입력 이미지 크기를 224 × 224로 통일하고, 출력층을 3개의 연속값(투과성 텐서 요소)으로 맞추었다.

학습 과정에서는 AdamW 옵티마이저에 기본 가중치 감쇠(1e‑4)와 코사인 학습률 스케줄링을 적용했으며, 초기 학습률은 1e‑3으로 설정하였다. 데이터 증강으로는 회전·좌우·상하 반전·노이즈 추가·스케일 변환을 포함했으며, 이는 이미지의 기하학적 변형이 투과성에 미치는 영향을 모델이 학습하도록 돕는다. 실험 결과, 데이터 증강을 적용한 경우 R²가 평균 0.003~0.007 정도 상승했으며, 학습 데이터 양을 6 000→24 000으로 확대했을 때도 비슷한 상승세를 보였다.

성능 비교에서는 ConvNeXt‑Small가 가장 높은 R² 0.99460을 기록했으며, ResNet‑101도 비슷한 수준(≈0.993)으로 뒤따랐다. ViT‑S16은 초기 수렴이 느리고, 과적합이 발생하면 성능이 급격히 저하되는 경향을 보였다. 또한 ConvNeXt와 ResNet은 에포크 50 ~ 70에서 최적점에 도달했으나, ViT는 120 에포크 이상이 필요했고, 지나치게 학습하면 검증 손실이 상승했다. 이는 컨볼루션 기반 모델이 지역적 패턴을 효율적으로 포착하는 반면, 트랜스포머는 전역적인 상관관계를 학습하는 데 더 많은 데이터와 정규화가 필요함을 시사한다.

결과적으로, 이미지‑기반 딥러닝은 기존 LBM 시뮬레이션 대비 수십 배 빠른 추론 속도를 제공하면서도, 0.994 수준의 높은 정확도를 달성한다. 이는 실시간 흐름 예측, 매개변수 최적화, 대규모 매체 설계 등에 직접 활용 가능함을 의미한다. 향후 연구에서는 3차원 구조 확장, 비주기적 경계조건 적용, 물리 기반 손실 함수 도입 등을 통해 모델의 일반화 능력을 더욱 강화할 수 있을 것으로 기대된다.

초록

상세 요약

📜 논문 원문 (영문)