마이크론 광섬유를 통한 512 512 이미지 단일 촬영 복원을 위한 TFUNet
초록
본 논문은 지름이 수백 마이크론에서 마이크론 수준으로 점진적으로 감소하는 테이퍼드 광섬유(TF)의 복잡한 스펙클 변형을 물리‑인식 U‑Net 구조인 TF‑UNet으로 해결한다. 계층적 그룹드‑MLP 융합을 스킵 연결에 삽입해 비국소·다중 스케일 의존성을 효과적으로 학습하고, 512 × 512 해상도의 단일 촬영 이미지 복원을 실험적으로 검증한다. TF‑UNet은 기존 U‑Net 변형 대비 구조적·지각적 품질이 우수하고, 메모리·연산 효율도 유지한다.
상세 분석
TF‑UNet은 테이퍼드 광섬유가 야기하는 공간‑변이(intermodal coupling) 스펙클을 모델링하기 위해 두 가지 핵심 아이디어를 도입한다. 첫째, 스킵 연결에 계층적 그룹드‑MLP(멀티‑레이어 퍼셉트론) 블록을 삽입해 채널 차원을 여러 그룹으로 나누고, 각 그룹에 독립적인 전역 혼합을 수행한다. 이는 전통적인 컨볼루션이 갖는 국소성 한계를 넘어, 모드 간 비국소 상호작용을 효율적으로 포착한다. 그룹 수는 인코더 깊이에 따라 0‑1‑2‑4 로 점진적으로 증가하도록 설계돼, 얕은 단계에서는 최소한의 연산으로 저주파 정보를 유지하고, 깊은 단계에서는 고차원 비국소 특성을 강화한다. 둘째, 정규화 항으로 직교성(orthogonality) 제약을 추가해 각 그룹의 특성이 서로 상관되지 않도록 강제한다. 이는 물리적으로 모드가 서로 직교한다는 전제와 일치하며, 학습 과정에서 모드 분리(disentanglement)를 촉진한다.
연산 복잡도 측면에서 그룹드‑MLP는 O(N²) 비용을 채널 효율적인 그룹화와 계층적 적용을 통해 실질적으로 선형에 가깝게 낮춘다. 따라서 512 × 512 크기의 스펙클 이미지라도 GPU 메모리 사용량이 기존 전역 MLP 기반 모델보다 크게 감소한다. 실험에서는 동일한 데이터셋(13 440 쌍, TF와 FF 각각 6 720 쌍)으로 훈련·검증·테스트를 8:1:1 비율로 분할하고, SSIM, MS‑SSIM, LPIPS, PSNR, Pearson correlation 등 다섯 가지 지표를 사용해 성능을 평가했다. TF‑UNet은 특히 SSIM·MS‑SSIM·LPIPS에서 기존 U‑Net 변형보다 3‑7 % 향상을 보였으며, PSNR은 거의 동일하거나 약간 상승했다. 메모리 사용량은 30 % 이상 절감되었고, 추론 시간도 비슷한 수준을 유지했다.
물리적 해석 측면에서는 TF‑UNet이 학습한 가중치가 테이퍼드 섬유의 기하학적 변화를 반영한다는 점이 주목된다. 그룹드‑MLP가 각 채널 그룹에 적용되는 변환은 모드 간 전이율 κ와 전파 상수 차이 Δβ의 비율 α(s)와 유사한 비선형 매핑을 학습한다. 따라서 모델은 비아다아빗(adiabatic) 구간과 비아다아빗 구간을 자동으로 구분하고, 강한 모드 교환이 일어나는 영역에서 더 높은 비국소 혼합을 수행한다. 이는 기존의 고정된 전송 행렬이나 단순 컨볼루션 기반 역변환이 갖는 한계를 극복하고, 실제 실험 환경에서의 변동성을 내재적으로 보정한다는 의미다.
요약하면, TF‑UNet은 테이퍼드 광섬유가 제공하는 고해상도, 저침습 이미지 전송을 단일 촬영으로 실현하기 위한 딥러닝 기반 역변환 프레임워크이며, 물리‑인식 설계와 효율적인 그룹드‑MLP 융합을 통해 비국소·다중 스케일 의존성을 효과적으로 학습한다.
댓글 및 학술 토론
Loading comments...
의견 남기기