LiFlow 3D LiDAR 장면 완성을 위한 흐름 매칭
초록
LiFlow는 기존의 확산 기반 LiDAR 장면 완성 모델이 겪는 훈련‑추론 초기 분포 불일치를 흐름 매칭(Flow Matching) 기법으로 해결한다. 최근접 이웃 흐름 매칭(NFM)과 Chamfer 거리 손실(CDM)을 결합해 점별 구조와 전역 커버리지를 동시에 최적화한다. SemanticKITTI와 Apollo 데이터셋에서 Chamfer Distance, Jensen‑Shannon Divergence, Voxel IoU 등 다양한 지표에서 최첨단 성능을 달성한다.
상세 분석
LiFlow는 3차원 LiDAR 포인트 클라우드의 장면 완성 문제를 확산 모델이 아닌 연속시간 흐름 매칭(Flow Matching, FM) 프레임워크로 재구성한다. 기존 DDPM 기반 방법은 Gaussian 노이즈를 예측하도록 설계돼 훈련 시 사용되는 초기 노이즈 분포와 추론 시 실제 LiDAR 스캔을 복제해 만든 초기 분포가 다르다는 근본적인 mismatch를 야기한다. 이는 특히 장거리·희소 영역에서 복원 품질을 저하시킨다. FM은 ODE 형태로 확산 과정을 기술하므로 사전 확률 가정이 필요 없으며, 초기와 목표 분포를 동일하게 설정할 수 있다.
LiFlow는 두 단계의 손실을 도입한다. 첫 번째는 Nearest Neighbor Flow Matching(NFM)이다. 여기서는 초기 노이즈 클라우드 (x_0)와 목표 완전 클라우드 (x_1) 사이의 점별 대응을 각 (x_0) 점의 최근접 이웃(NN)으로 정의한다. 이를 통해 흐름 (\phi_{N}^{t})와 벡터 필드 (v_{N}^{t})를 데이터‑의존 커플링 형태인 (\phi_{C}^{t}=t x_1+(1-t)x_0)와 유사하게 구성한다. NFM 손실은 예측된 벡터 필드와 실제 NN 차이 ((\text{NN}(x_0,x_1)-x_0)) 사이의 L2 차이를 최소화한다. 이 과정은 점‑대‑점 구조를 보존하면서도 초기 분포와 목표 분포 사이의 매끄러운 변환을 학습한다.
두 번째는 Chamfer Distance Matching(CDM)이다. NFM만으로는 다중 (x_0) 점이 동일한 (x_1) 점에 매핑되는 일대다 관계가 발생해 점 밀도가 낮아지는 현상이 있다. CDM은 변환 후의 점 집합과 목표 집합 사이의 Chamfer Distance를 직접 최소화함으로써 전역적인 커버리지를 강화한다. 즉, 흐름이 전체 장면을 골고루 채우도록 유도한다.
모델 아키텍처는 기존 LiDAR‑Diffusion 연구에서 사용된 MinkUNet을 그대로 채택하고, 배치 정규화 대신 인스턴스 정규화를 적용해 포인트 클라우드의 변동성을 더 잘 다룬다. 훈련 시 클래스‑프리 가이던스(classifier‑free guidance)를 이용해 조건 (c) (실제 스캔 (P) 또는 빈 입력)와 무조건 입력을 혼합한다. 손실 가중치는 (\lambda_{NFM}=1, \lambda_{CDM}=0.1)으로 설정해 구조 보존과 전역 커버리지를 균형 있게 학습한다.
실험에서는 SemanticKITTI와 Apollo Columbia Park 두 데이터셋을 사용해 10‑step Euler ODE 통합으로 추론한다. Chamfer Distance, Jensen‑Shannon Divergence, 다중 해상도 Voxel IoU 등 6가지 지표에서 기존 Diffusion 기반 LiDiff, LiDPM, 그리고 voxel‑기반 LMSCNet·LODE·MID·PVD 등을 모두 앞선다. 특히 refinement network를 추가했을 때 CD가 0.023 수준으로 가장 낮으며, JSD와 Voxel IoU에서도 최고 점수를 기록한다. 이는 NFM이 초기 분포 불일치를 해소하고, CDM이 점 밀도와 전역 형태를 보강함으로써 얻어진 결과이다.
LiFlow의 주요 공헌은 (1) 3D LiDAR 장면 완성을 위한 최초의 흐름 매칭 프레임워크 제시, (2) 초기‑목표 분포 불일치를 해결하기 위한 최근접 이웃 흐름 매칭과 Chamfer 거리 손실의 결합, (3) 기존 Diffusion 기반 방법들을 전반적으로 능가하는 성능 입증이다. 향후 연구에서는 더 정교한 조건부 흐름 설계, 실시간 추론을 위한 경량화, 그리고 다른 센서(예: 라이다‑카메라 융합)와의 통합 가능성을 탐색할 여지가 있다.
댓글 및 학술 토론
Loading comments...
의견 남기기