기공 스케일 CO2 물 상호작용 머신러닝 데이터셋 벤치마크

안내: 본 포스트의 한글 요약 및 분석 리포트는 AI 기술을 통해 자동 생성되었습니다. 정보의 정확성을 위해 하단의 [원본 논문 뷰어] 또는 ArXiv 원문을 반드시 참조하시기 바랍니다.

초록

본 논문은 고해상도 2차원 기공 구조와 CO₂‑물 다상 흐름 시뮬레이션 결과를 포함한 624개의 샘플을 제공한다. 각 샘플은 512 × 512 픽셀, 해상도 35 µm이며 100개의 시간 단계에 걸친 포화도, 압력, 속도 등을 기록한다. 다양한 입도와 공간 변동성을 5단계 이질성으로 설계해 머신러닝 모델의 일반화 능력 평가에 최적화된 벤치마크 데이터셋을 구축하였다.

상세 분석

이 연구는 기공 스케일에서 CO₂와 물의 복합 상호작용을 정량화하기 위해 두 가지 핵심 요소를 결합한다. 첫째, 입자 크기와 위치를 무작위 교란시켜 5단계의 이질성을 구현한 기공 구조 생성 파이프라인을 제공한다. 여기서 반경 교란(raddevmax)과 위치 교란(xdevmax, ydevmax)은 각각 0.05~~0.25와 0.02~~0.10의 비율로 설정돼 실제 사암의 입도 분포와 유사한 모양을 만든다. 이러한 파라미터 스위프는 평균 입경 R₀ = 70, 80, 90 µm와 다공도 φ = 0.20~0.45를 조합해 90개의 기본 이미지를 생성하고, 시각적 검토 후 78개만을 최종 사용한다. 이후 1024 × 1024 이미지를 4개 사분면으로 나누고 수직 대칭을 적용해 총 624개의 학습용 이미지가 확보된다.

둘째, GeoChemFoam 기반의 다상 흐름 시뮬레이션을 수행한다. 알제브라적 Volume‑of‑Fluid(VOF) 방법과 연속 표면 힘(CSF) 모델을 이용해 Navier‑Stokes 방정식과 상 전이 방정식을 풀며, CO₂는 1 × 10⁻⁸ m³/s의 일정 유량으로 왼쪽 경계에서 주입된다. 물과 CO₂의 물성(밀도, 점도, 계면 장력, 접촉각)도 실제 지하 저장 조건에 맞게 설정했으며, 시뮬레이션은 1 s까지 0.01 s 간격으로 저장된다. 결과는 포화도(α_water), 압력(p), 모세관 압력(p_c), 수평·수직 속도(Ux, Uy) 등 5가지 필드와 기공 구조 바이너리 이미지(img)로 HDF5 파일에 정리된다.

데이터셋의 유용성을 검증하기 위해 U‑Net 기반 3가지 모델을 훈련시켰다. 모델 A는 전체 5‑Level 데이터를, 모델 B는 4‑Level(레벨5 제외), 모델 C는 레벨1만 사용했다. 네 단계 연속 포화도를 입력으로 다음 네 단계 예측하도록 학습하고, 자동 회귀 방식으로 60 단계까지 확장했다. 평균 제곱 오차(MSE) 결과는 A = 0.0145, B = 0.0254, C = 0.0320으로, 데이터 다양성이 모델 일반화에 미치는 긍정적 영향을 확인했다. 다만 일부 샘플에서는 B 모델이 C 모델보다 성능이 떨어지는 등 과다 다양성이 오히려 편향을 초래할 수 있음을 지적한다.

이러한 설계는 (1) 고해상도 시공간 데이터 제공, (2) 이질성 수준별 체계적 변이, (3) 다중 물리량 동시 제공이라는 세 축에서 기존 256 × 256 규모 데이터셋을 뛰어넘는다. 따라서 기공 스케일 다상 흐름을 학습하는 딥러닝·물리‑인포머 모델 개발에 필수적인 벤치마크로 활용될 수 있다.

기공 스케일 CO2 물 상호작용 머신러닝 데이터셋 벤치마크

초록

상세 분석

댓글 및 학술 토론

의견 남기기