위상 보존 딥 합성소스‑채널 코딩으로 의미 통신 혁신
본 논문은 이미지 전송 시 전역 구조와 연결성을 보존하기 위해, 지속가능 동형학(persistent homology) 기반 정규화를 DeepJSCC에 통합한 TopoJSCC 프레임워크를 제안한다. 원본·재구성 이미지와 채널 전·후 잠재 공간의 위상 차이를 Wasserstein 거리로 최소화함으로써 저 SNR·저 대역폭 환경에서도 PSNR과 위상 보존 성능을 동시에 향상시킨다.
저자: Omar Erak, Omar Alhussein, Fang Fang
본 논문은 자율주행, 원격 진단 등에서 이미지의 전역 구조와 연결성이 핵심적인 의미를 갖는 상황을 목표로, 기존 DeepJSCC가 픽셀‑레벨 MSE 손실에만 초점을 맞추어 위상적 오류를 방지하지 못한다는 한계를 지적한다. 이를 해결하기 위해 TopoJSCC라는 새로운 프레임워크를 제안한다. TopoJSCC는 두 가지 지속가능 동형학(persistent homology) 기반 정규화 손실을 기존 MSE 손실에 추가한다. 첫 번째는 이미지 도메인 위상 손실이다. 입력 이미지를 큐빅 복합체로 모델링하고, 밝은 영역을 강조하는 슈퍼레벨 집합 필터레이션을 적용해 0‑차와 1‑차 영속도표를 생성한다. 원본 이미지와 재구성 이미지의 영속도표 사이를 2‑Wasserstein 거리로 측정해 L_img_top을 정의함으로써, 재구성 과정에서 연결 성분과 루프가 보존되도록 강제한다. 두 번째는 잠재 공간 위상 손실이다. 배치 내 모든 인코더 출력 벡터를 점군으로 보고, Euclidean 거리 기반 Vietoris–Rips 필터레이션을 적용해 0‑차와 1‑차 영속도표를 만든다. 채널 잡음이 적용된 후의 점군과 원본 점군 사이의 Wasserstein 거리를 L_lat_top으로 정의해, 인코더가 채널 변동에도 잠재 매니폴드의 전역 형태(클러스터, 분기, 루프)를 유지하도록 학습한다. 두 정규화 손실은 미분 가능한 PH 레이어를 통해 역전파가 가능하도록 구현되었으며, 전체 손실은 L_batch = MSE + λ_img·L_img_top + λ_lat·L_lat_top 형태로 구성된다. λ 파라미터는 사전 학습된 DeepJSCC 모델을 기준으로 손실 규모를 정규화하고, 검증 데이터에서 PSNR와 위상 정확도 사이의 최적 트레이드오프를 찾도록 조정한다. 또한, 학습 초기에 위상 손실이 과도하게 영향을 미치지 않도록 지수적 annealing 스케줄을 적용한다. 실험 설정은 두 개의 위상‑풍부한 데이터셋(Omniglot 손글씨와 DeepGlobe 도로 마스크)을 사용했으며, AWGN 및 Rayleigh 페이딩 채널을 고려했다. 모든 모델은 동일한 CNN 기반 인코더·디코더 구조를 사용하고, 대역폭 비율 ρ를 0.05~0.50 범위에서 변동시켰다. 비교 대상은 기존 DeepJSCC, 전통적인 BPG+LDPC 디지털 전송, 그리고 TopoCode(위상 정보를 사이드 정보로 전송하는 디지털 방식)이다. 결과는 저 SNR(0~10 dB) 및 저 대역폭(ρ≤0.2) 상황에서 TopoJSCC가 영속도표 Wasserstein 거리와 위상 오류를 크게 감소시키면서 PSNR도 기존 DeepJSCC와 동등하거나 약간 향상된다는 것을 보여준다. 특히 이미지 도메인 위상 손실이 채널 잡음에 강인한 잠재 매니폴드 형성에 기여함을 확인했으며, 추가적인 위상 계산 비용은 학습 단계에만 존재하고 추론 시에는 전혀 부과되지 않는다. 논문은 의미 통신에서 구조적 의미를 손실 함수에 직접 반영함으로써, 전통적인 픽셀‑레벨 최적화만으로는 달성하기 어려운 전역 구조 보존을 가능하게 하는 중요한 전진을 제시한다.
원본 논문
고화질 논문을 불러오는 중입니다...
댓글 및 학술 토론
Loading comments...
의견 남기기