대규모 모델로 풀어낸 지진 전파역학 실전 복원
초록
**
본 논문은 1 억 파라미터 규모의 트랜스포머와 VQ‑GAN 토크나이저를 결합한 새로운 데이터‑구동 전파역학(FWI) 프레임워크를 제안한다. 제한된 합성 데이터만으로도 5백만 쌍 이상의 속도‑지진 데이터를 인공적으로 생성해 학습함으로써, 기존 소규모 모델이 실패하던 Marmousi·Salt·Overthrust·BP·Sigsbee·SEAM 등 실제 지질 베치마크에서 SSIM을 0.58→0.77 수준으로 크게 향상시킨다. 핵심은(1) 모델 용량 확대, (2) 데이터 다양성 증대, (3) 비인과적(비‑causal) 병렬 디코딩, (4) 강화학습 기반 지도 정렬, (5) 잠재공간 그래디언트 미세조정이라는 5단계 스케일링 전략이다.
**
상세 분석
**
논문은 기존 데이터‑구동 FWI가 “데이터 부족 → 과적합 → 일반화 실패”라는 구조적 한계에 빠져 있음을 정확히 지적한다. 이를 극복하기 위해 저자는 세 축(모델 용량, 데이터 다양성, 학습 전략)의 동시 확대를 제안한다. 첫 번째 축인 모델 용량에서는 1 억 파라미터 규모의 트랜스포머 백본을 채택했으며, 이는 지진 파형과 속도 지도 사이의 전역적인 상관관계를 토큰 수준에서 완전하게 학습하도록 설계되었다. 특히, 기존의 인과적(autoregressive) 디코딩을 포기하고 비인과적(parallel) 디코딩을 도입함으로써 모든 속도 토큰을 동시에 예측하도록 하여 연산 효율성을 10배 이상 높이고, 전역 컨텍스트 활용을 극대화했다.
두 번째 축인 데이터 다양성 확보는 ‘잠재 확산 모델(latent diffusion)’을 이용해 속도 지도를 인공적으로 생성하고, 이를 물리 기반 어쿠스틱 시뮬레이터로부터 대응 지진 데이터를 합성함으로써 훈련 샘플을 408 k에서 5 M 이상으로 확대한 점이 핵심이다. 이 과정에서 지질 구조가 서로 섞인 하이브리드 모델을 만들었으며, 실제 베치마크에 존재하는 복합적인 염전·단층·불규칙성 등을 사전에 학습시켰다.
세 번째 축인 학습 전략은 두 단계로 나뉜다. 첫 단계는 지도 학습(pre‑training)으로, 시퀀스‑투‑시퀀스 토큰 매핑을 교차 엔트로피 손실로 학습한다. 두 번째 단계는 강화학습(RL) 기반의 포스트‑트레이닝이다. 여기서는 모델을 확률 정책으로 보고, 전체 속도 지도 수준에서 지질 연속성·물리 일관성을 보상하는 보상을 설계했다. GRPO 방식의 정책 최적화를 통해 토큰 수준의 로컬 오류를 넘어 지도 전체의 구조적 정확도를 끌어올렸다.
마지막으로, 물리 기반 후처리로 잠재공간(continuous latent)에서 그래디언트 디센트를 수행한다. VQ‑GAN 디코더의 연속적인 잠재 벡터 z에 대해 전방 시뮬레이션 잔차를 최소화하는 손실을 정의하고, 이를 통해 미세한 고주파 지질 디테일을 보존하면서 전역적인 물리 일관성을 강화한다. 이때 직접 속도 지도에 대한 업데이트가 아니라 잠재공간에서의 업데이트를 수행함으로써 전통적인 FWI가 겪는 불안정성을 크게 완화한다.
실험 결과는 단계별 기여도를 정량적으로 보여준다. 데이터 증강만으로도 SSIM이 0.58→0.66으로 상승하고, 비인과적 디코딩과 VIT‑VQGAN 토크나이저 도입이 추가로 0.03~0.05 정도의 이득을 제공한다. 강화학습과 잠재공간 미세조정을 합치면 최종 SSIM 0.77을 달성한다. 특히, OpenFWI 합성 테스트셋에서는 기존 최고 기록을 넘어섰으며, 실제 지질 베치마크(6개)에서도 평균 SSIM 0.71을 기록, 기존 BigFWI(0.58) 대비 30% 이상 개선했다.
이 논문은 “대규모 모델 + 합성 데이터”라는 접근이 지구물리학 분야에서도 충분히 실용적이며, 물리 기반 제약을 손실 함수와 후처리 단계에 자연스럽게 녹여낼 수 있음을 입증한다. 향후 더 복잡한 3D FWI, 다중 물리(탄성·전기) 결합, 그리고 실제 현장 데이터에 대한 도메인 적응 연구에 대한 기반을 제공한다.
**
댓글 및 학술 토론
Loading comments...
의견 남기기