고반사 물체 3D 복원을 위한 라틴 디퓨전 기반 구조광
초록
본 논문은 고반사·저거칠기 표면에서 발생하는 스페큘러 반사와 간접조명으로 인한 프린지 왜곡·손실 문제를 해결하기 위해, 프린지 이미지의 잠재 표현을 추출하고 이를 조건으로 하는 라틴 디퓨전 모델을 제안한다. 스페큘러 반사 인코더, 시변 채널 어핀 레이어, 어텐션 모듈을 통해 반사 특성을 효과적으로 반영하며, 입력 프린지 수를 줄이면서도 고품질 복원 프린지를 생성한다. 실험 결과 평균 RMSE를 1.8176 mm에서 0.9619 mm로 절반 수준으로 낮추어 기존 최첨단 방법을 크게 능가한다.
상세 분석
LD‑SLRO는 고반사 물체의 프린지 투사 측정에서 가장 큰 장애인 스페큘러 하이라이트와 인터리플렉션을 데이터‑드리븐 방식으로 완화한다는 점에서 혁신적이다. 기존 방법들은 하드웨어 보강(다중 노출, 마스크)이나 단순 노이즈 제거에 머물렀지만, 본 연구는 프린지 이미지 자체를 확률적 생성 모델인 라틴 디퓨전(Latent Diffusion)으로 재구성한다. 핵심은 두 개의 인코더이다. 첫 번째인 Diffuse Reflection Autoencoder는 24채널의 위상‑시프트 프린지 스택을 입력으로 받아 잠재 공간에 압축하고, 복원된 프린지를 디코더가 재생성한다. 두 번째인 Specular Reflection Encoder는 스페큘러 반사에 특화된 특징을 추출해 다변량 가우시안으로 매핑한다. 이렇게 얻은 두 잠재 변수는 시간‑변화 채널 어핀 레이어를 통해 디퓨전 단계마다 동적으로 결합된다. 즉, 초기 고노이즈 단계에서는 스페큘러 특성이 강하게 반영되고, 점차 디노이징이 진행될수록 프린지 구조가 정교해지는 메커니즘이다. 어텐션 모듈은 전역적인 컨텍스트를 포착해 지역적인 하이라이트와 왜곡을 동시에 보정한다. 학습 목표는 직접적인 클린 샘플 x₀를 예측하도록 설계된 L₂ 손실이며, 이는 고차원 잠재 공간에서 노이즈 예측보다 안정적인 수렴을 보장한다. 실험에서는 입력 프린지 수를 4개로 제한하면서도 24채널 출력 프린지를 생성해, 기존 24‑프레임 방식 대비 획득 속도를 크게 향상시켰다. 정량적 평가에서 RMSE가 0.96 mm까지 감소했으며, 시각적으로도 과포화 영역이 복원되고 프린지 파형이 원형에 가깝게 회복되는 것을 확인했다. 한계점으로는 대규모 라벨링된 고반사 데이터셋이 필요하고, 디퓨전 단계가 많을 경우 추론 시간이 증가한다는 점이다. 향후 경량화된 디노이저 설계와 실시간 적용을 위한 단계 최적화가 필요하다.
댓글 및 학술 토론
Loading comments...
의견 남기기