테라헤르츠 이미지 복원을 위한 자동인코더 기반 최적화기 학습

테라헤르츠(THz) 영상에서 물리 파라미터를 추정하는 비선형 최적화 문제를, 물리 모델을 디코더로 고정한 모델 기반 자동인코더(AE)로 해결한다. 인코더가 직접 파라미터를 예측하도록 학습시켜, 기존 수치 최적화보다 140배 빠르게 결과를 얻으며, 손실값은 거의 동일하다. 또한 이 예측값을 초기값으로 사용하면 전통적인 최적화가 2배 이상 빠르게 수렴한다.

저자: Tak Ming Wong, Matthias Kahl, Peter Haring Bolivar

테라헤르츠 이미지 복원을 위한 자동인코더 기반 최적화기 학습
테라헤르츠(THz) 영상은 비파괴 검사, 재료 분석, 보안 등 다양한 분야에서 활용 가능성이 높은 센싱 기술이다. 그러나 실제 측정값은 물리적으로 의미 있는 파라미터(전기장 진폭 ĕ, 펄스 폭 σ, 표면 위치 µ, 위상 φ)와 직접적인 관계가 없으며, 이 파라미터들을 추정하기 위해서는 비선형 역문제인 모델 피팅을 수행해야 한다. 기존에는 L2 손실을 최소화하는 수치 최적화(예: MATLAB Trust‑Region)를 각 픽셀마다 적용했지만, 이미지 해상도가 높아질수록 연산량이 급증해 실시간 처리에 한계가 있었다. 이 논문은 이러한 문제를 해결하기 위해 “모델 기반 자동인코더(Model‑Based Autoencoder)”라는 새로운 학습 프레임워크를 제안한다. 자동인코더의 디코더를 물리 모델 fĕ,σ,µ,φ(z) 로 고정하고, 인코더를 신경망으로 설계해 입력된 복소수 THz 신호 g(x) 로부터 직접 네 파라미터를 예측하도록 한다. 학습 목표는 인코더가 출력한 파라미터를 디코더에 넣었을 때 재구성된 신호와 원본 신호 사이의 L2 차이를 최소화하는 비지도 손실이다. 이렇게 하면 실제 측정 데이터만으로도 네트워크를 학습시킬 수 있어 시뮬레이션 기반의 지도 학습에서 발생하는 모델·노이즈 불일치 문제를 회피한다. 데이터 전처리에서는 메인 로브와 주요 사이드 로브에 해당하는 91개의 깊이 샘플만을 추출해 입력 차원을 크게 줄였다. 인코더는 1×1 컨볼루션을 이용해 픽셀별 독립적인 연산을 수행하도록 설계했으며, 실수·허수 채널을 각각 처리한 뒤 concat하고, 3개의 컨볼루션‑배치정규화‑LeakyReLU 블록을 거쳐 Fully‑Connected 레이어에서 4개의 파라미터를 출력한다. 진폭 ĕ 는 물리적 제약을 만족하도록 절댓값 연산을 적용한다. 학습은 Adam 옵티마이저를 사용해 80 % 픽셀을 훈련, 20 %를 검증에 할당하고, 배치 크기 4096, 초기 학습률 0.005, 20 epoch마다 0.99 비율로 감소시키는 스케줄로 1200 epoch 진행하였다. 훈련·검증 손실이 거의 동일하게 수렴해 과적합이 없음을 확인했다. 실험에서는 두 개의 실제 THz 데이터셋을 사용하였다. 첫 번째는 446×446 픽셀 규모의 MetalPCB 데이터로, 구리 패턴과 PCB 재질이 혼합된 표면을 측정하였다. 두 번째는 113×575 픽셀 규모의 StepChart 데이터로, 알루미늄 블록의 급격한 높이 변화를 포함한다. 제안된 인코더는 기존 Trust‑Region 최적화에 비해 140배 이상 빠르게 파라미터를 추정했으며, 손실값은 1–2 % 정도만 증가하였다. 또한, 인코더가 제공한 파라미터를 초기값으로 사용하면 전통적인 최적화가 약 2배 빠르게 수렴하고, 최종 손실도 더 낮아졌다. 이 논문의 주요 기여는 다음과 같다. (1) 물리 모델을 디코더에 고정함으로써 실제 측정 데이터에 대한 비지도 학습이 가능하도록 한 점. (2) 1×1 컨볼루션 기반의 경량 인코더 설계로 GPU 병렬성을 활용해 실시간 수준의 추정 속도를 달성한 점. (3) 학습된 인코더를 기존 최적화 파이프라인에 초기화 단계로 활용해 정확도와 속도 모두를 향상시킨 점. 이러한 접근법은 THz 외에도 물리 모델이 명시적인 다양한 영상·신호 복원 문제에 일반화될 수 있다.

원본 논문

고화질 논문을 불러오는 중입니다...

댓글 및 학술 토론

Loading comments...

의견 남기기