벡터 데이터를 이미지로 변환해 지구과학 역문제 해결

이 논문은 지구과학 분야에서 흔히 마주치는 ‘역문제’를 새로운 방식으로 접근한다. 전통적인 역문제는 관측된 데이터와 모델 파라미터 사이의 비선형 관계를 반복적인 최적화 과정으로 풀어야 하는데, 이는 전방 모델링 비용이 크게 소요되고 초기값에 민감한 단점이 있다. 저자들은 이러한 한계를 극복하고자, 1차원 측정 벡터(시간‑시계열)와 2차원 지하 모델 사이의 직접적인 매핑을 학습하는 딥 뉴럴 네트워크 ‘vec2pix’를 설계하였다. 네트워크 구조는 크게 두 부분으로 나뉜다. 첫 번째는 1D 합성곱 층을 여러 단계 쌓아 입력 벡터를 점점 더 많은 채널을 가진 저차원 특징 맵으로 변환한다. 두 번째는 이 1D 특징 맵을 reshape 연산을 통해 2D 텐서로 바꾸고, 이후 ResNet 블록과 전치 합성곱(transposed convolution) 레이어를 이용해 공간 해상도를 확대하면서 최종 지하 모델을 출력한다. 이 과정에서 저수준 정보를 공유하지 않아도 되도록 설계된 것이 핵심이다. 학습은 L1 재구성 손실을 최소화하는 방식으로 진행되며, 다중가우시안 연속값 문제와 범주형(채널화) 문제에 각각 다른 학습률을 적용한다. 데이터 노이즈는 각 에폭마다 새로운 가우시안 화이트 노이즈를 추가해 모델이 실제 측정 오차에 강인하도록 만든다. 또한, 다중가우시안 경우에는 후처리로 중간값 필터를 적용해 잡음을 억제한다. 실험은 두 가지 합성 역문제에 대해 수행되었다. 첫 번째는 교차천 GPR 여행시간을 이용해 2D 전파 속도(즉, 유전율) 분포를 복원하는 문제이며, 두 번째는 다중정거장 펌핑에 의해 발생하는 압력 헤드 시계열을 이용해 2D 수리전도도(K) 분포를 복원하는 문제이다. 각각의 경우에 대해 다중가우시안과 채널화된 이진 토양 구조라는 두 가지 사전분포를 사용했다. GPR 실험은 128 × 64 격자(셀 크기 0.1 m)에서 625개의 여행시간을 수집했으며, 펌핑 실험은 80 × 128 격자(셀 크기 1 m)에서 1 040개의 헤드 데이터를 수집했다. 전방 모델링은 pyGIMLi와 MODFLOW‑NWT를 이용해 각각 전자기 파와 지하수 흐름을 시뮬레이션하였다. 학습 데이터는 20 000개의 (모델, 데이터) 쌍으로 구성했으며, 이는 전방 시뮬레이션 20 000번을 수행해야 함을 의미한다. 추가 실험에서는 학습 샘플을 10 000개와 5 000개로 줄여도 성능 저하가 제한적임을 확인했다. 테스트는 독립적인 1 000개의 샘플에 대해 수행했으며, 복원된 모델은 시각적으로 실제 모델과 매우 유사했지만, 전방 시뮬레이션을 다시 수행했을 때 데이터 적합도는 노이즈 수준보다 다소 큰 편이었다. 이는 완전한 데이터 적합을 목표로 할 경우, vec2pix가 제공하는 모델을 전통적인 역학 방법(예: 다중점 통계 역전)의 초기값으로 활용하는 것이 바람직함을 시사한다. 불확실성 정량화는 ‘딥 앙상블’ 방식을 채택했다. 무작위 초기화로 훈련된 5개의 네트워크를 독립적으로 학습시킨 뒤, 각 모델이 생성한 복원 결과의 변동성을 통해 예측 불확실성을 추정했다. 이 방법은 Monte Carlo dropout이나 서브스페이스 샘플링보다 더 넓은 불확실성 범위를 포착한다는 기존 연구와 일치한다. 결과적으로, vec2pix는 전통적인 반복 역학 프로세스를 대체하거나 보조할 수 있는 강력한 도구임을 입증한다. 특히 전방 모델링 비용이 높은 경우에도 비교적 적은 학습 샘플만으로 일반화된 매핑을 학습할 수 있어 실용성이 높다. 향후 연구 과제로는 실제 현장 데이터 적용, 3D 구조 확장, 앙상블 규모 확대를 통한 불확실성 정밀화, 그리고 다른 유형의 측정(예: 전기저항, 중력)과의 통합이 있다. 이러한 발전은 지구과학 전반에 걸쳐 데이터‑주도형 역문해석을 가속화할 것으로 기대된다.

벡터 데이터를 이미지로 변환해 지구과학 역문제 해결

원본 논문

댓글 및 학술 토론

의견 남기기

원본 논문

관련 논문

댓글 및 학술 토론

의견 남기기